728x90
불러온 데이터 프레임을 기반으로 기본적인 편집해보기 |
1. 개요
안녕하세요. 이번 시간에는 CSV에서 불러온 데이터 프레임을 기본적으로 편집하는 방법에 대해 다룹니다. 데이터 프레임의 자료를 확인하고, 필요에 따라 JOIN으로 병합하거나 DROP 하는 방법에 대해 적혀 있습니다. 자세한 내용은 코드를 확인하세요.
- 출력물 한글 폰트 설정 >> 차트 등의 LABEL에서 한글이 깨지지 않게 됨.
- 데이터프레임의 자료형태(str,boolean,int...) 확인
- CSV 불러오면서 날짜 인식시키기
- 다수의 데이터프레임을 단순히 Append 형식으로 병합
- 데이터프레임) JOIN으로 병합
- 데이터프레임에서 특정 column 제거(drop) 시키기
- 데이터프레임에서 특정 row를 index 값 기준으로 제거(drop) 시키기
- 데이터프레임에서 column index를 동시에 사용하여 특정값 drop 시키기
- 데이터프레임으로 인식
- 데이터 프레임에 칼럼 이름 부여
- 특정 칼럼(X) 내 ROW 중복값 세기
- A 데이터 프레임의 'C'칼럼의 데이터 '값'만 가져옴
- 데이터프레임 정렬하기
- 2개의 칼럼 값을 합친 새로운 Column 생성
- 자료 형식이 안맞아서 합쳐지지 않을경우 아래와 같이 MAPPING 처리
- CSV 저장
2. 코드
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
# Check FootPrint Conformance | |
# 모델과 로그 Trace를 리스트로 구현 | |
model = ['a', 'b', 'c', 'd', 'e', 'f', 'g'] | |
log = ['a', 'b', 'c', 'd', 'f', 'g', 'e'] | |
model_list_self = [] | |
log_list_self = [] | |
# 모델 경우의 수 파악 | |
for i in range(0, len(model)-1): | |
next_value = i + 1 | |
if next_value <= len(model)-1: | |
tuple_element = (model[i], model[next_value]) | |
model_list_self.append(tuple_element) | |
else: | |
pass | |
# 로그 경우의 수 파악 | |
for i in range(0, len(log_trace)-1): | |
next_value = i + 1 | |
if next_value <= len(log_trace)-1: | |
tuple_element = (log_trace[i], log_trace[next_value]) | |
log_list_self.append(tuple_element) | |
else: | |
pass | |
same_value = list(set(model_list_self) & set(log_list_self)) | |
model_lst_check = list(set(model_list_self) & set(same_value)) | |
log_lst_check = list(set(log_list_self) & set(same_value)) | |
lst_check = model_lst_check + log_lst_check | |
sum_value = model_list_self + log_list_self | |
len_sum = len(sum_value) | |
# 불일치 경우의 수 파악 | |
len_uncorrected = len(sum_value) - len(lst_check) | |
# Fitness 계산 | |
fitness_value = round((1 - (len_uncorrected / len_sum))*100,0) |
728x90
'DATA' 카테고리의 다른 글
[Python pandas] 데이터프레임(dataframe)에서 중복 데이터 확인하기 (0) | 2019.10.06 |
---|---|
[Python pandas] 데이터프레임(dataframe)에서 특정 칼럼을 제외한 칼럼만 선택하기 (0) | 2019.10.06 |
[Python pandas] 데이터프레임(dataframe)에서 데이터타입(dtype)에 부합하는 칼럼만 가져오기 (0) | 2019.10.06 |
Python 데이터 분석 #1 : CSV 데이터 불러오기 (0) | 2018.12.26 |
MS-SQL의 DB를 csv로 추출하는 방법 (0) | 2018.08.18 |
파이썬(주피터 노트북) 주석처리할 때 방법 (0) | 2018.08.13 |