소개
# 데이터 프레임에서 특정 칼럼 내에서 특정 값이 포함된 row만 가져옵니다
자료 출처
# https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.contains.html
라이브러리 및 데이터 불러오기
# 라이브러리
import pandas as pd
# 데이터
mock_data = pd.read_csv('MOCK_DATA.csv')
mock_data.head(3)
|
id |
ssn |
first_name |
last_name |
email |
gender |
ip_address |
city |
country |
car_make |
car_model |
0 |
1 |
352-83-7834 |
Josselyn |
Commuzzo |
jcommuzzo0@shop-pro.jp |
Female |
NaN |
Aībak |
Afghanistan |
GMC |
Yukon XL 2500 |
1 |
2 |
129-55-2802 |
Aksel |
Cubbin |
acubbin1@rakuten.co.jp |
Male |
NaN |
Gaya |
Nigeria |
Cadillac |
CTS |
2 |
3 |
421-78-0056 |
Marwin |
Vagg |
NaN |
Male |
NaN |
Huangjiakou |
China |
Chevrolet |
Tahoe |
임의의 값이 포함된 row 가져오기
- 여러개를 할 경우 | 로 구분하면 됩니다 (ex: Afghanistan|Nigeria|korea )
mock_data_filtered = mock_data[mock_data['country'].str.contains("Afghanistan|Nigeria")]
mock_data_filtered.head(5)
|
id |
ssn |
first_name |
last_name |
email |
gender |
ip_address |
city |
country |
car_make |
car_model |
0 |
1 |
352-83-7834 |
Josselyn |
Commuzzo |
jcommuzzo0@shop-pro.jp |
Female |
NaN |
Aībak |
Afghanistan |
GMC |
Yukon XL 2500 |
1 |
2 |
129-55-2802 |
Aksel |
Cubbin |
acubbin1@rakuten.co.jp |
Male |
NaN |
Gaya |
Nigeria |
Cadillac |
CTS |
52 |
53 |
341-57-6179 |
Kathlin |
Klimaszewski |
kklimaszewski1g@sogou.com |
Female |
43.188.223.129 |
Kusheriki |
Nigeria |
NaN |
LS |
133 |
134 |
NaN |
Alessandra |
Lodford |
alodford3p@shutterfly.com |
Female |
NaN |
Sapele |
Nigeria |
Infiniti |
NaN |
192 |
193 |
772-29-0119 |
Caralie |
Terry |
cterry5c@vimeo.com |
Female |
214.86.189.6 |
Kafir Qala |
Afghanistan |
Mercedes-Benz |
E-Class |