728x90
소개
# 데이터 프레임에서 특정 칼럼 내에서 특정 값이 포함된 row만 가져옵니다
자료 출처
# https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.contains.html
라이브러리 및 데이터 불러오기
# 라이브러리
import pandas as pd
# 데이터
mock_data = pd.read_csv('MOCK_DATA.csv')
mock_data.head(3)
id | ssn | first_name | last_name | gender | ip_address | city | country | car_make | car_model | ||
---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 352-83-7834 | Josselyn | Commuzzo | jcommuzzo0@shop-pro.jp | Female | NaN | Aībak | Afghanistan | GMC | Yukon XL 2500 |
1 | 2 | 129-55-2802 | Aksel | Cubbin | acubbin1@rakuten.co.jp | Male | NaN | Gaya | Nigeria | Cadillac | CTS |
2 | 3 | 421-78-0056 | Marwin | Vagg | NaN | Male | NaN | Huangjiakou | China | Chevrolet | Tahoe |
임의의 값이 포함된 row 가져오기
- 여러개를 할 경우 | 로 구분하면 됩니다 (ex: Afghanistan|Nigeria|korea )
mock_data_filtered = mock_data[mock_data['country'].str.contains("Afghanistan|Nigeria")]
mock_data_filtered.head(5)
id | ssn | first_name | last_name | gender | ip_address | city | country | car_make | car_model | ||
---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 352-83-7834 | Josselyn | Commuzzo | jcommuzzo0@shop-pro.jp | Female | NaN | Aībak | Afghanistan | GMC | Yukon XL 2500 |
1 | 2 | 129-55-2802 | Aksel | Cubbin | acubbin1@rakuten.co.jp | Male | NaN | Gaya | Nigeria | Cadillac | CTS |
52 | 53 | 341-57-6179 | Kathlin | Klimaszewski | kklimaszewski1g@sogou.com | Female | 43.188.223.129 | Kusheriki | Nigeria | NaN | LS |
133 | 134 | NaN | Alessandra | Lodford | alodford3p@shutterfly.com | Female | NaN | Sapele | Nigeria | Infiniti | NaN |
192 | 193 | 772-29-0119 | Caralie | Terry | cterry5c@vimeo.com | Female | 214.86.189.6 | Kafir Qala | Afghanistan | Mercedes-Benz | E-Class |
728x90
'DATA' 카테고리의 다른 글
파이썬에서 MS-SQL 테이블 가져오기 예제 (0) | 2020.05.25 |
---|---|
특정 값일 때 데이터프레임의 특정 칼럼에 값 넣기 (0) | 2019.10.21 |
[Python pandas] 특정 칼럼의 특정값이 들어간 row를 제거하기 (0) | 2019.10.21 |
[Python pandas] MS SQL에 접속하여 테이블 가져오기 (0) | 2019.10.15 |
[Python pandas] 데이터프레임(dataframe)에서 NA값 Drop 시키기 (0) | 2019.10.15 |
[Python pandas] 데이터프레임(dataframe)에서 그룹 기준으로 누적계산하기 (0) | 2019.10.09 |