728x90
728x90
Contents 2장 1절 - 서브 쿼리 서브쿼리란? 하나의 SQL문 안에 포함되어 있는 또다른 SQL문을 의미한다. 서브쿼리 사용 시 주의 사항 서브 쿼리는 괄호로 감싸서 기술 서브 쿼리는 단일행(single row) 또는 복수 행(multiple row) 비교 연산자와 함께 사용 가능. 단일행 비교 연산자는 서브쿼리 결과가 반드시 1건 이하여야 하고, 복수행 비교 연산자는 서브 쿼리의 결과 건수와 무관 중첩 서브 쿼리 및 스칼라 서브 쿼리에서는 order by를 사용하지 못한다. 서브 쿼리의 분류 동작 방식에 따른 서브쿼리 분류 반환 데이터 형태에 따른 서브쿼리 분류 단일 행 서브쿼리 서브쿼리가 단일행 비교 연산자(=, >,
Contents관계형 데이터베이스 개요데이터베이스DBMS(Database Management System)라고 호칭관계형 데이터 베이스 : 데이터 정합성 보장에 대한 고민의 결과물, 메타 데이터 총괄 관리 이점, 데이터 무결성(Integrity) 보장 등...SQLSQL(Structured Query Language)관계형 데이터베이스에서 데이터 정의, 데이터 조작, 데이터 제어를 위해 사용 언어ANSI/ISO에 따라 표준 정의된 SQL 기능이 존재SQL 문장의 종류 (DML, DDL, DCL, TCL)STANDARD SQL (기출문제 보고 더 많이 나올 것 같으면 추가 공부)테이블데이터는 DB의 기본 단위인 테이블 형태로 저장어느 특정한 주제와 목적으로 만들어지는 일종의 집합테이블은 삭제하지 않는 한 ..
Key ResultsSQLP 과목1 - 데이터 모델링의 이해 부분 정리 Contents정규화정규화(Normlization)은 가장 기초적이지만 필수적으로 이뤄져야 하는 작업.제1 정규형 : 모든 속성은 반드시 하나의 값을 가져야 한다아래와 같이 중복된 값이 없도록 엔터티 추가 필요제2정규형 : 엔터티의 일반속성은 주식별자 전체에 종속적이여야 한다.데이터가 반복 사용되는 것을 방지하기 위해 일반 속성은 주식별자 전체에 종속적이여야 한다. 2번째 이미지처럼 주문상세 엔터티에서는 상품번호만 가지고 있고, 상품번호를 매핑하여 상품명 데이터를 가져올 수 있다. 이를 흔히 Join이라고 한다.제3정규형 : 엔터티의 일반속성 간에서는 서로 종속적이지 않다.고객이 이름을 바꿔 고객명이 변경되었다면 주문 엔터티에 고객명..
Contents 모델링의 이해 모델링의 정의 웹스터 사전 : 가설적, 일정 양식에 맞춘 표현 복잡한 현실세계를 단순화해서 표현 현상세계를 추상화한 반영 사물 또는 사건에 대한 양상(aspect)나 관점(perspective)를 연관된 사람이나 그룹을 위해 명확하게 하는 거 모델링의 특징 추상화 : 현실세계를 일정 형식에 맞춰 표현 단순화 : 복잡한 현실세계를 제한된 표기법이나 언어로 표현 명확화 : 누구나 이해하기 쉽게 현상 기술 모델리의 3가지 관점 데이터 관점 : 업무가 어떤 데이터와 연관이 있는지, 데이터 간 관계가 무엇인지에 대해 모델링(what, data) 프로세스 관점 : 실제하고 있는 업무는 무엇인지, 무엇을 해야하는지 모덜렝(how, process) 데이터와 프로세스의 상관 관점 : 업무가..
2018년부터 2020년까지 진행했던 정부과제 데이터 분석 프로젝트에 대한 회고입니다. 분석 및 개발 업무 자체는 거의 혼자서 진행했기 때문에 이것저것 배운 게 많았습니다. 물론 보안 상 상당수는 말할 수는 없겠지만 대략 어떤 분석이 있었고, 다음에는 어떤 걸 하지 말아야지 하는 정도의 회고를 써볼까 합니다. 대략 어떤 프로젝트였는가 하면... 제가 진행했던 프로젝트는 제품을 생산하는 공장 데이터를 바탕으로 진행되었으며, 차수 별로 진행되었는데요. 제가 참여하는 전체 기간 중 분기 별로 아래 3가지 일을 진행하였습니다. 크게 EDA를 기반으로 모델링을 수행하는 절차라고 보면 될 듯 합니다. A분기 → 데이터 특성 조사 및 필요 데이터 요약 B분기 → 제품 생산시간 예측 모델링 C분기 → 예측 모델 기반 ..
참고 문서 본 문서는 아래 링크의 내용을 follow-up 하는 것입니다. https://myterraincognito.tistory.com/70 https://dataleader.tistory.com/5 빠진 내용이 있어서(정확히는 편의상 생략) 전부 따라가려고 작성하였습니다. 1. 엑셀 파워쿼리 설치 엑셀 파워쿼리는 엑셀 상에서 데이터 전처리를 위한 추가 기능으로서 아래 링크에서 다운로드 가능합니다 (오피스 2013 이상만 설치 가능하고 최신 버전은 이미 포함되어 있을 수 있음 → 그럴 경우 설치 종료) https://www.microsoft.com/ko-kr/download/details.aspx?id=39379 설치가 완료되었다면 엑셀 실행 시 아래와 같이 "데이터" 탭이 생긴 것을 볼 수가 있습..
import pandas as pd d = {'NAME': ['PIKACHU', 'GYARADOS', 'LAPRAS', 'Rattata', 'ZAPDOS'], 'NUM': [10, 250, 10, 20, 700], 'ENERGY' : [1, 1, 1, 1, 1]} df = pd.DataFrame(data=d) df NAME NUM ENERGY 0 PIKACHU 10 1 1 GYARADOS 250 1 2 LAPRAS 10 1 3 Rattata 20 1 4 ZAPDOS 700 1 누적합(cumsum) 수행 NUM이 10일 때까지 ENERGY의 값을 누적하여 저장 NUM이 10이 되는 순간 다시 cumsum을 reset하고 재 누적합 계산 시작 df['cumsum'] = df.groupby((df.NUM ==..
개요 파이썬 딕셔너리를 사용해서 데이터프레임을 생성하는 예제입니다. 코드 레퍼런스 https://kongdols-room.tistory.com/106