상세 컨텐츠

본문 제목

[Python pandas] 특정 칼럼의 특정값이 들어간 row를 제거하기

데이터/머신러닝

by 에스프리터 2019.10.21 17:45

본문

소개
# 데이터 프레임에서 특정 칼럼의 특정값이 들어간 row를 제거합니다
자료 출처
# https://stackoverflow.com/questions/22392786/excluding-rows-from-a-pandas-dataframe-based-on-column-value-and-not-index-value

라이브러리 및 데이터 불러오기

# 라이브러리
import pandas as pd

# 데이터
mock_data = pd.read_csv('MOCK_DATA.csv')
mock_data.head(3)
  id ssn first_name last_name email gender ip_address city country car_make car_model
0 1 352-83-7834 Josselyn Commuzzo jcommuzzo0@shop-pro.jp Female NaN Aībak Afghanistan GMC Yukon XL 2500
1 2 129-55-2802 Aksel Cubbin acubbin1@rakuten.co.jp Male NaN Gaya Nigeria Cadillac CTS
2 3 421-78-0056 Marwin Vagg NaN Male NaN Huangjiakou China Chevrolet Tahoe
누적할 대상 값을 임의로 생성하기(여기선 1을 값으로 삽입)
# mask 씌울 항목 선정 - 여기서는 country에서 아프간과 나이지리아를 제외
mask = mock_data['country'].isin(['Afghanistan', 'Nigeria'])
mock_data[~mask].head() # ~를 포함하게 되면 mask의 값을 제외, ~을 제외하면 mask의 값을 포함입니다.
  id ssn first_name last_name email gender ip_address city country car_make car_model
2 3 421-78-0056 Marwin Vagg NaN Male NaN Huangjiakou China Chevrolet Tahoe
3 4 NaN Michele Freed NaN Male 95.30.236.76 Ferrol Spain Volvo NaN
4 5 821-40-7635 Skip Sallan ssallan4@nymag.com Male 200.83.222.220 Sheffield United Kingdom GMC Canyon
5 6 854-88-6296 Belia Cushworth bcushworth5@blinklist.com Female 255.52.106.120 Nueve de Julio Argentina Dodge Ram
6 7 650-58-6287 Thane Baltzar tbaltzar6@infoseek.co.jp Male 89.251.85.176 Kikuchi Japan Pontiac Firefly

관련글 더보기

댓글 영역