소개
# 데이터 프레임에서 특정 칼럼의 특정값이 들어간 row를 제거합니다
자료 출처
# https://stackoverflow.com/questions/22392786/excluding-rows-from-a-pandas-dataframe-based-on-column-value-and-not-index-value
라이브러리 및 데이터 불러오기
# 라이브러리
import pandas as pd
# 데이터
mock_data = pd.read_csv('MOCK_DATA.csv')
mock_data.head(3)
|
id |
ssn |
first_name |
last_name |
email |
gender |
ip_address |
city |
country |
car_make |
car_model |
0 |
1 |
352-83-7834 |
Josselyn |
Commuzzo |
jcommuzzo0@shop-pro.jp |
Female |
NaN |
Aībak |
Afghanistan |
GMC |
Yukon XL 2500 |
1 |
2 |
129-55-2802 |
Aksel |
Cubbin |
acubbin1@rakuten.co.jp |
Male |
NaN |
Gaya |
Nigeria |
Cadillac |
CTS |
2 |
3 |
421-78-0056 |
Marwin |
Vagg |
NaN |
Male |
NaN |
Huangjiakou |
China |
Chevrolet |
Tahoe |
누적할 대상 값을 임의로 생성하기(여기선 1을 값으로 삽입)
# mask 씌울 항목 선정 - 여기서는 country에서 아프간과 나이지리아를 제외
mask = mock_data['country'].isin(['Afghanistan', 'Nigeria'])
mock_data[~mask].head() # ~를 포함하게 되면 mask의 값을 제외, ~을 제외하면 mask의 값을 포함입니다.
|
id |
ssn |
first_name |
last_name |
email |
gender |
ip_address |
city |
country |
car_make |
car_model |
2 |
3 |
421-78-0056 |
Marwin |
Vagg |
NaN |
Male |
NaN |
Huangjiakou |
China |
Chevrolet |
Tahoe |
3 |
4 |
NaN |
Michele |
Freed |
NaN |
Male |
95.30.236.76 |
Ferrol |
Spain |
Volvo |
NaN |
4 |
5 |
821-40-7635 |
Skip |
Sallan |
ssallan4@nymag.com |
Male |
200.83.222.220 |
Sheffield |
United Kingdom |
GMC |
Canyon |
5 |
6 |
854-88-6296 |
Belia |
Cushworth |
bcushworth5@blinklist.com |
Female |
255.52.106.120 |
Nueve de Julio |
Argentina |
Dodge |
Ram |
6 |
7 |
650-58-6287 |
Thane |
Baltzar |
tbaltzar6@infoseek.co.jp |
Male |
89.251.85.176 |
Kikuchi |
Japan |
Pontiac |
Firefly |
댓글 영역