728x90
소개
# 데이터 프레임에서 특정 칼럼의 특정값이 들어간 row를 제거합니다
자료 출처
# https://stackoverflow.com/questions/22392786/excluding-rows-from-a-pandas-dataframe-based-on-column-value-and-not-index-value
라이브러리 및 데이터 불러오기
# 라이브러리
import pandas as pd
# 데이터
mock_data = pd.read_csv('MOCK_DATA.csv')
mock_data.head(3)
id | ssn | first_name | last_name | gender | ip_address | city | country | car_make | car_model | ||
---|---|---|---|---|---|---|---|---|---|---|---|
0 | 1 | 352-83-7834 | Josselyn | Commuzzo | jcommuzzo0@shop-pro.jp | Female | NaN | Aībak | Afghanistan | GMC | Yukon XL 2500 |
1 | 2 | 129-55-2802 | Aksel | Cubbin | acubbin1@rakuten.co.jp | Male | NaN | Gaya | Nigeria | Cadillac | CTS |
2 | 3 | 421-78-0056 | Marwin | Vagg | NaN | Male | NaN | Huangjiakou | China | Chevrolet | Tahoe |
누적할 대상 값을 임의로 생성하기(여기선 1을 값으로 삽입)
# mask 씌울 항목 선정 - 여기서는 country에서 아프간과 나이지리아를 제외
mask = mock_data['country'].isin(['Afghanistan', 'Nigeria'])
mock_data[~mask].head() # ~를 포함하게 되면 mask의 값을 제외, ~을 제외하면 mask의 값을 포함입니다.
id | ssn | first_name | last_name | gender | ip_address | city | country | car_make | car_model | ||
---|---|---|---|---|---|---|---|---|---|---|---|
2 | 3 | 421-78-0056 | Marwin | Vagg | NaN | Male | NaN | Huangjiakou | China | Chevrolet | Tahoe |
3 | 4 | NaN | Michele | Freed | NaN | Male | 95.30.236.76 | Ferrol | Spain | Volvo | NaN |
4 | 5 | 821-40-7635 | Skip | Sallan | ssallan4@nymag.com | Male | 200.83.222.220 | Sheffield | United Kingdom | GMC | Canyon |
5 | 6 | 854-88-6296 | Belia | Cushworth | bcushworth5@blinklist.com | Female | 255.52.106.120 | Nueve de Julio | Argentina | Dodge | Ram |
6 | 7 | 650-58-6287 | Thane | Baltzar | tbaltzar6@infoseek.co.jp | Male | 89.251.85.176 | Kikuchi | Japan | Pontiac | Firefly |
728x90
'DATA' 카테고리의 다른 글
파이썬에서 Dict를 사용해서 DataFrame 생성 예제 (0) | 2020.05.26 |
---|---|
파이썬에서 MS-SQL 테이블 가져오기 예제 (0) | 2020.05.25 |
특정 값일 때 데이터프레임의 특정 칼럼에 값 넣기 (0) | 2019.10.21 |
[Python pandas] 칼럼 내 특정 값을 가진 row만 가져오기 (0) | 2019.10.21 |
[Python pandas] MS SQL에 접속하여 테이블 가져오기 (0) | 2019.10.15 |
[Python pandas] 데이터프레임(dataframe)에서 NA값 Drop 시키기 (0) | 2019.10.15 |