728x90
728x90
import pandas as pd d = {'NAME': ['PIKACHU', 'GYARADOS', 'LAPRAS', 'Rattata', 'ZAPDOS'], 'NUM': [10, 250, 10, 20, 700], 'ENERGY' : [1, 1, 1, 1, 1]} df = pd.DataFrame(data=d) df NAME NUM ENERGY 0 PIKACHU 10 1 1 GYARADOS 250 1 2 LAPRAS 10 1 3 Rattata 20 1 4 ZAPDOS 700 1 누적합(cumsum) 수행 NUM이 10일 때까지 ENERGY의 값을 누적하여 저장 NUM이 10이 되는 순간 다시 cumsum을 reset하고 재 누적합 계산 시작 df['cumsum'] = df.groupby((df.NUM ==..
소개 # 데이터 프레임에서 특정 값이 있을 경우 특정 칼럼에 값을 넣습니다 자료 출처 # https://stackoverflow.com/questions/53253433/insert-value-into-a-dataframe-column-based-on-condition 라이브러리 및 데이터 불러오기 # 라이브러리 import pandas as pd # 데이터 mock_data = pd.read_csv('MOCK_DATA.csv') mock_data.head(3) id ssn first_name last_name email gender ip_address city country car_make car_model 0 1 352-83-7834 Josselyn Commuzzo jcommuzzo0@shop-pro..
소개 # 데이터 프레임에서 특정 칼럼의 특정값이 들어간 row를 제거합니다 자료 출처 # https://stackoverflow.com/questions/22392786/excluding-rows-from-a-pandas-dataframe-based-on-column-value-and-not-index-value 라이브러리 및 데이터 불러오기 # 라이브러리 import pandas as pd # 데이터 mock_data = pd.read_csv('MOCK_DATA.csv') mock_data.head(3) id ssn first_name last_name email gender ip_address city country car_make car_model 0 1 352-83-7834 Josselyn Com..
소개 # 데이터 프레임에서 특정 칼럼 내에서 특정 값이 포함된 row만 가져옵니다 자료 출처 # https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.contains.html 라이브러리 및 데이터 불러오기 # 라이브러리 import pandas as pd # 데이터 mock_data = pd.read_csv('MOCK_DATA.csv') mock_data.head(3) id ssn first_name last_name email gender ip_address city country car_make car_model 0 1 352-83-7834 Josselyn Commuzzo jcommuzzo0@shop-pro.jp Fe..
소개 # pymssql을 사용하여 ms sql에 접속하여 테이블을 추출합니다. 자료 출처 # http://pythonstudy.xyz/python/article/208-MSSQL-%EC%82%AC%EC%9A%A9 라이브러리 및 데이터 불러오기 # 라이브러리 import pandas as pd import pymssql # 접속 정보 정의 conn = pymssql.connect(server='192.168.0.1', user='ID', password='PASSWORD', port=NUMBER) SQL 문 정의 sql_statement = ''' SELECT * FROM TABLE ''' DB에 접속하여 가져오기 data = pd.read_sql(sql=sql_statement, con=conn) dat..
소개 # 데이터 프레임에서 전체 데이터 기준이나 특정 칼럼 기준으로 NA(결측치)를 제거합니다. 자료 출처 # https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.dropna.html 라이브러리 및 데이터 불러오기 # 라이브러리 import pandas as pd # 데이터 mock_data = pd.read_csv('MOCK_DATA.csv') mock_data.head(3) id ssn first_name last_name email gender ip_address city country car_make car_model 0 1 352-83-7834 Josselyn Commuzzo jcommuzzo0@shop-pro...