'Pandas' 태그의 글 목록

Pandas : 조건에 따른 데이터프레임 누적합 계산

import pandas as pd d = {'NAME': ['PIKACHU', 'GYARADOS', 'LAPRAS', 'Rattata', 'ZAPDOS'], 'NUM': [10, 250, 10, 20, 700], 'ENERGY' : [1, 1, 1, 1, 1]} df = pd.DataFrame(data=d) df NAME NUM ENERGY 0 PIKACHU 10 1 1 GYARADOS 250 1 2 LAPRAS 10 1 3 Rattata 20 1 4 ZAPDOS 700 1 누적합(cumsum) 수행 NUM이 10일 때까지 ENERGY의 값을 누적하여 저장 NUM이 10이 되는 순간 다시 cumsum을 reset하고 재 누적합 계산 시작 df['cumsum'] = df.groupby((df.NUM ==..

format_list_bulleted DATA
· 2020. 9. 11.
textsms

특정 값일 때 데이터프레임의 특정 칼럼에 값 넣기

소개 # 데이터 프레임에서 특정 값이 있을 경우 특정 칼럼에 값을 넣습니다 자료 출처 # https://stackoverflow.com/questions/53253433/insert-value-into-a-dataframe-column-based-on-condition 라이브러리 및 데이터 불러오기 # 라이브러리 import pandas as pd # 데이터 mock_data = pd.read_csv('MOCK_DATA.csv') mock_data.head(3) id ssn first_name last_name email gender ip_address city country car_make car_model 0 1 352-83-7834 Josselyn Commuzzo jcommuzzo0@shop-pro..

format_list_bulleted DATA
· 2019. 10. 21.
textsms

[Python pandas] 특정 칼럼의 특정값이 들어간 row를 제거하기

소개 # 데이터 프레임에서 특정 칼럼의 특정값이 들어간 row를 제거합니다 자료 출처 # https://stackoverflow.com/questions/22392786/excluding-rows-from-a-pandas-dataframe-based-on-column-value-and-not-index-value 라이브러리 및 데이터 불러오기 # 라이브러리 import pandas as pd # 데이터 mock_data = pd.read_csv('MOCK_DATA.csv') mock_data.head(3) id ssn first_name last_name email gender ip_address city country car_make car_model 0 1 352-83-7834 Josselyn Com..

format_list_bulleted DATA
· 2019. 10. 21.
textsms

[Python pandas] 칼럼 내 특정 값을 가진 row만 가져오기

소개 # 데이터 프레임에서 특정 칼럼 내에서 특정 값이 포함된 row만 가져옵니다 자료 출처 # https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.contains.html 라이브러리 및 데이터 불러오기 # 라이브러리 import pandas as pd # 데이터 mock_data = pd.read_csv('MOCK_DATA.csv') mock_data.head(3) id ssn first_name last_name email gender ip_address city country car_make car_model 0 1 352-83-7834 Josselyn Commuzzo jcommuzzo0@shop-pro.jp Fe..

format_list_bulleted DATA
· 2019. 10. 21.
textsms

[Python pandas] MS SQL에 접속하여 테이블 가져오기

소개 # pymssql을 사용하여 ms sql에 접속하여 테이블을 추출합니다. 자료 출처 # http://pythonstudy.xyz/python/article/208-MSSQL-%EC%82%AC%EC%9A%A9 라이브러리 및 데이터 불러오기 # 라이브러리 import pandas as pd import pymssql # 접속 정보 정의 conn = pymssql.connect(server='192.168.0.1', user='ID', password='PASSWORD', port=NUMBER) SQL 문 정의 sql_statement = ''' SELECT * FROM TABLE ''' DB에 접속하여 가져오기 data = pd.read_sql(sql=sql_statement, con=conn) dat..

format_list_bulleted DATA
· 2019. 10. 15.
textsms

[Python pandas] 데이터프레임(dataframe)에서 NA값 Drop 시키기

소개 # 데이터 프레임에서 전체 데이터 기준이나 특정 칼럼 기준으로 NA(결측치)를 제거합니다. 자료 출처 # https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.dropna.html 라이브러리 및 데이터 불러오기 # 라이브러리 import pandas as pd # 데이터 mock_data = pd.read_csv('MOCK_DATA.csv') mock_data.head(3) id ssn first_name last_name email gender ip_address city country car_make car_model 0 1 352-83-7834 Josselyn Commuzzo jcommuzzo0@shop-pro...

format_list_bulleted DATA
· 2019. 10. 15.
textsms

[Python pandas] 데이터프레임(dataframe)에서 그룹 기준으로 누적계산하기

소개 # 데이터 프레임에서 특정 칼럼이 유지될 동안 대상 칼럼의 값을 누적합니다. # index 번호 기준으로 내려가다가 값이 바뀌면 해당 group에서 다시 시작합니다. # 이전 group 값이 다시 시작될 경우 해당 값에서 다시 누적 계산이 시작됩니다. 자료 출처 # https://stackoverflow.com/questions/32847800/how-can-i-use-cumsum-within-a-group-in-pandas 라이브러리 및 데이터 불러오기 # 라이브러리 import pandas as pd # 데이터 mock_data = pd.read_csv('MOCK_DATA.csv') mock_data.head(3) id ssn first_name last_name email gender ip_a..

format_list_bulleted DATA
· 2019. 10. 9.
textsms

[Python pandas] 데이터프레임(dataframe)에서 null 값만 찾아내기

라이브러리 및 데이터 불러오기 # 라이브러리 import pandas as pd # 데이터 mock_data = pd.read_csv('MOCK_DATA.csv') mock_data.head(3) id ssn first_name last_name email gender ip_address city country car_make car_model 0 1 352-83-7834 Josselyn Commuzzo jcommuzzo0@shop-pro.jp Female NaN Aībak Afghanistan GMC Yukon XL 2500 1 2 129-55-2802 Aksel Cubbin acubbin1@rakuten.co.jp Male NaN Gaya Nigeria Cadillac CTS 2 3 421-78-00..

format_list_bulleted DATA
· 2019. 10. 8.
textsms