Pandas : 조건에 따른 데이터프레임 누적합 계산

728x90

import pandas as pd
d = {'NAME': ['PIKACHU', 'GYARADOS', 'LAPRAS', 'Rattata', 'ZAPDOS'],
     'NUM': [10, 250, 10, 20, 700],
    'ENERGY' : [1, 1, 1, 1, 1]}
df = pd.DataFrame(data=d)
df

	NAME	NUM	ENERGY
0	PIKACHU	10	1
1	GYARADOS	250	1
2	LAPRAS	10	1
3	Rattata	20	1
4	ZAPDOS	700	1

누적합(cumsum) 수행

NUM이 10일 때까지 ENERGY의 값을 누적하여 저장
NUM이 10이 되는 순간 다시 cumsum을 reset하고 재 누적합 계산 시작

df['cumsum'] = df.groupby((df.NUM == 10).cumsum()).ENERGY.cumsum()
df

	NAME	NUM	ENERGY	cumsum
0	PIKACHU	10	1	1
1	GYARADOS	250	1	2
2	LAPRAS	10	1	1
3	Rattata	20	1	2
4	ZAPDOS	700	1	3

728x90

저작자표시 비영리 (새창열림)

'DATA' 카테고리의 다른 글

SQLD 1과목 1장(데이터 모델링의 이해) 정리 (0)	2021.05.23
3년간 진행했던 데이터 분석 프로젝트 회고 (0)	2021.05.22
카카오톡 대화내용 엑셀 파워쿼리로 정리하기 (0)	2021.03.06
파이썬에서 Dict를 사용해서 DataFrame 생성 예제 (0)	2020.05.26
파이썬에서 MS-SQL 테이블 가져오기 예제 (0)	2020.05.25
특정 값일 때 데이터프레임의 특정 칼럼에 값 넣기 (0)	2019.10.21

누적합(cumsum) 수행

'DATA' 카테고리의 다른 글

티스토리툴바