칼럼 선택 (여러개 선택해도 가능, 다만 많아지만 데이터프레임의 칼럼 개수가 너무 많아지게 됨)
select_column = ['gender']
ONE HOT ENCODING 함수 정의
def one_hot_encoding(train_data):
for cate in select_column: #ONE HOT ENCODING 처리
prefix = cate #붙여둘 단어를 value 자체로함. 이건 다르게 설정 가능
one_hot_encoding = pd.get_dummies(train_data[[cate]], prefix=prefix) #OHE 진행
train_data = pd.concat([pd.DataFrame(train_data), one_hot_encoding],axis=1) #기존 데이터프레임에 합쳐주기
train_data = train_data.drop(cate,axis=1) #ONE HOT ENCODING 대상이었던 칼럼은 삭제
return train_data.copy()
gender가 사라지고, gender_Female, gender_Male 칼럼이 생긴 것을 확인할 수 있음
댓글 영역