상세 컨텐츠

본문 제목

[Python pandas] 칼럼 내 특정 값을 가진 row만 가져오기

데이터/머신러닝

by 에스프리터 2019.10.21 17:22

본문

소개
# 데이터 프레임에서 특정 칼럼 내에서 특정 값이 포함된 row만 가져옵니다
자료 출처
# https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.contains.html

라이브러리 및 데이터 불러오기

# 라이브러리
import pandas as pd

# 데이터
mock_data = pd.read_csv('MOCK_DATA.csv')
mock_data.head(3)
  id ssn first_name last_name email gender ip_address city country car_make car_model
0 1 352-83-7834 Josselyn Commuzzo jcommuzzo0@shop-pro.jp Female NaN Aībak Afghanistan GMC Yukon XL 2500
1 2 129-55-2802 Aksel Cubbin acubbin1@rakuten.co.jp Male NaN Gaya Nigeria Cadillac CTS
2 3 421-78-0056 Marwin Vagg NaN Male NaN Huangjiakou China Chevrolet Tahoe
임의의 값이 포함된 row 가져오기
  • 여러개를 할 경우 | 로 구분하면 됩니다 (ex: Afghanistan|Nigeria|korea )
mock_data_filtered = mock_data[mock_data['country'].str.contains("Afghanistan|Nigeria")]
mock_data_filtered.head(5)
  id ssn first_name last_name email gender ip_address city country car_make car_model
0 1 352-83-7834 Josselyn Commuzzo jcommuzzo0@shop-pro.jp Female NaN Aībak Afghanistan GMC Yukon XL 2500
1 2 129-55-2802 Aksel Cubbin acubbin1@rakuten.co.jp Male NaN Gaya Nigeria Cadillac CTS
52 53 341-57-6179 Kathlin Klimaszewski kklimaszewski1g@sogou.com Female 43.188.223.129 Kusheriki Nigeria NaN LS
133 134 NaN Alessandra Lodford alodford3p@shutterfly.com Female NaN Sapele Nigeria Infiniti NaN
192 193 772-29-0119 Caralie Terry cterry5c@vimeo.com Female 214.86.189.6 Kafir Qala Afghanistan Mercedes-Benz E-Class

관련글 더보기

댓글 영역