에스프리터🐕

고정 헤더 영역

글 제목

메뉴 레이어

espriter

메뉴 리스트

    • 전체보기 (134)
      • ProjectManagement (2)
      • BookMark (0)
      • DATA (45)
        • DataAnalytics (3)
        • DataEngineer (1)
        • MachineLearning (1)
        • SQL-Transform (40)
      • DEVELOPMENT (43)
        • MacOS (0)
        • Linux (10)
        • Windows (5)
        • Python (9)
        • Java (17)
        • Device (1)
        • Network (1)
      • CLOUD (38)
        • AWS (11)
        • Azure (6)
        • GCP (1)
        • Docker (8)
        • Kubernetes (0)
      • MEMO (6)
        • IDEA (4)
        • Photos (2)

    검색 레이어

    espriter

    검색 영역

    컨텐츠 검색

    CLOUD/AWS

    • [TIL] AWS 재해복구(DR) 관련 단어 메모

      2022.11.11 by 에스프리터

    • [TIL] AWS CLI s3 sync를 사용하여 파일 전송하기 221028

      2022.10.28 by 에스프리터

    • [TIL] AWS redshift에 Copy 명령어로 csv 데이터 적재 시 csv 내에 json이 포함되어 있을 때 고려해야 할 데이터 변환 파라미터 종류 221026

      2022.10.26 by 에스프리터

    • [TIL] AWS Redshift에서 block이 걸려서 쿼리가 지연될 때 확인하고 강제 종료하는 방법 221017

      2022.10.17 by 에스프리터

    • [TIL] AWS Athena에서 쿼리 진행 상태 확인하기

      2022.10.05 by 에스프리터

    • [TIL] AWS Athena에서 Json 값 추출 220927

      2022.09.27 by 에스프리터

    • [TIL] AWS cli를 사용해서 s3 파일 일괄 다운받기 220921

      2022.09.21 by 에스프리터

    • [TIL] AWS Athena에서 기존 파티션 drop하고, 신규 파티션 생성 220920

      2022.09.20 by 에스프리터

    [TIL] AWS 재해복구(DR) 관련 단어 메모

    📝💡Today I Learned 요약 (32회차) - 재해 복구 관련 AWS에서는 복구시점(RPO)와 복구시간(RTO)를 정의하고 이에 맞춰 DR 전략을 수립할 것을 권고하고 있다. - 다중 동기화/복원이 많을 수록 워크로드는 안정되지만 그만큼 비용이 급상승하게 된다.AWS 재해복구(DR) 관련 단어 메모카카오 서비스 셧다운 쯤해서 나도 재해복구(Disaster Recovery)에 대해 보다 관심을 가지게 되었다. 있을 순 있지만 남일이라고 생각하고 있었다는 게 적절할 것 같다. 실제로 겪어본 적도 없고… 하지만 카카오가 당하는 걸 보면서 나도 관련 개념에 대해 이해할 필요가 있다고 느껴서 메모를 정리하게 되었다. 우선 AWS의 재해복구 관련 문서를 찾아보고 관련 단어(개념)들에 대해 메모해두려고 한다...

    CLOUD/AWS 2022. 11. 11. 16:02

    [TIL] AWS CLI s3 sync를 사용하여 파일 전송하기 221028

    💡 Today I Learned 요약 (28회차) - AWS CLI의 sync를 통해 여러개의 파일을 전송할 수 있다. AWS CLI s3 sync를 사용하여 파일 전송하기 오늘 아침 출근하면서 사수에게서 데이터 파이프라인에 문제가 생겼다는 얘기를 들었다. 원인 자체는 간단히 필드가 밀려서 데이터가 들어오고 있던 상황. 결과론적으론 간단하지만 그걸 찾기 위해 로그를 찍어가며 찾아가는 과정에 시간이 소요되었다. 그간 Appsflyer 데이터 적재한다고 본업(?)에 손을 못대고 있었는데 다시끔 포커스를 맞출 필요가 있다. 데이터 확인 과정에서 AWS CLI에서 s3 sync를 쓸 수 있는 것을 알게 되었다. 지난번 포스팅에서 CP를 사용하는 걸 올린 적이 있는데 --recursive 까지 하면서 여러개의 파..

    CLOUD/AWS 2022. 10. 28. 21:04

    [TIL] AWS redshift에 Copy 명령어로 csv 데이터 적재 시 csv 내에 json이 포함되어 있을 때 고려해야 할 데이터 변환 파라미터 종류 221026

    💡 Today I Learned 요약 (27회차) - redshift에 csv 파일을 Copy 쿼리로 적재할 때 json이 있을 경우 아래 파라미터를 고려할 필요 있음 AWS redshift에 Copy 명령어로 csv 데이터 적재 시 csv 내에 json이 포함되어 있을 때 고려해야 할 데이터 변환 파라미터 종류 s3에 올라간 csv를 기반으로 Redshift에 적재할 때 csv 내에 json 데이터가 포함되어 있고, 그것을 단일 칼럼 내에 로드하고 싶을 때 고려해야 할 데이터 변환 파라미터다. 아직 하나하나가 어떻게 동작하는지는 정확하게 이해하지 못해서 추후 다시 정리가 필요함. CSV -- CSV 명시 IGNOREHEADER 1 -- 지정 row number를 무시 DELIMITER ',' -- 구분..

    CLOUD/AWS 2022. 10. 26. 17:00

    [TIL] AWS Redshift에서 block이 걸려서 쿼리가 지연될 때 확인하고 강제 종료하는 방법 221017

    💡 Today I Learned 요약 (26회차) - Redshift에서는 세션 보호를 위해 특정 쿼리 동작 중에 추가 쿼리 동작을 잠글 수 있다. - 쿼리를 통해 잠금 처리된 쿼리를 확인하고 종료시켜 롤백할 수 있다. AWS Redshift에서 block이 걸려서 쿼리가 지연될 때 확인하고 종료하는 방법 Redshift에서 풀스캔 쿼리가 아닌데 이유 없이 돌고 있을 경우 잠금(block) 처리된 것을 의심할 수 있다. 보통은 block을 유발한 쿼리가 완료되면 block이 풀리고 후속 쿼리가 실행이 되지만 데이터 전처리 도중 다른 쿼리가 동작하여 block이 발생할 경우 시간에 쫓기게 될 수 있다. 그럴 때 확인 방법 및 종료, 쿼리 확인 방법에 대해 정리한다. redshift 문서에서 정의하는 쿼리 ..

    CLOUD/AWS 2022. 10. 17. 23:04

    [TIL] AWS Athena에서 쿼리 진행 상태 확인하기

    💡 Today I Learned 요약 (24회차) - boto3에선 Athena 쿼리 상태를 확인하는 batch_get_query_execution가 존재 - 해당 기능을 사용해서 Athena가 쿼리를 돌고 있는지 상태를 확인할 수 있다. boto3를 사용해서 Athena 쿼리 실행 상태 확인하기 Python 기반의 AWS SDK인 boto3를 사용해서 Athena 쿼리를 실행할 수 있다. 하지만 boto3로 Athena 쿼리를 실행할 경우 async로 돌아가기 때문에 쿼리를 날렸다고 바로 결과를 확인할 수 있는 게 아니다. 그럴 때 사용하기 위한 batch_get_query_execution가 boto3에 존재한다. query 실행했을 때의 ExecutionID를 알고 있다면 아래와 같이 batch_g..

    CLOUD/AWS 2022. 10. 5. 21:09

    [TIL] AWS Athena에서 Json 값 추출 220927

    💡 Today I Learned 요약 (18회차) - AWS Athena에 json 형태로 저장된 값에서 데이터를 추출할 수 있다 - 사용함수는 json_extract 함수를 사용하면 가능 AWS Athena에서 Json 값 추출 DB에 Json 형태로 값이 저장되어 있을 경우, Json을 parsing 해서 써야 하는데 AWS Athena의 경우 json_extract 함수를 통해서 key 기준 값을 추출할 수 있도록 하고 있다. WITH dataset AS ( SELECT '{"name": "Smith", "org": "Tech", "projects": [{"name":"project1", "completed":false}, {"name":"project2", "completed":true}]}' A..

    CLOUD/AWS 2022. 9. 27. 23:05

    [TIL] AWS cli를 사용해서 s3 파일 일괄 다운받기 220921

    💡 Today I Learned 요약 (9회차) - AWS CLI를 사용해서 s3 데이터를 일괄 다운 받을 수 있다 - 명령어는 aws cp를 사용하면 됨 AWS cli를 사용해서 s3 파일 일괄 다운받기 AWS s3에 있는 데이터를 다운 받고 싶을 때 웹 화면에서는 폴더 단위로 일괄 다운로드를 지원하지 않는다. 그래서 개별로 하나하나 들어가서 다운을 받아야 하는데 이럴 경우엔 AWS CLI를 쓰는 게 편리함. 1. AWS 홈페이지에서 CLI를 다운받고 설치 2. 터미널(명령 프롬프트)를 열고 aws configure를 입력하여 설정값 입력 aws configure AWS Access Key ID [None]: AWS Secret Access Key [None]: Default region name [N..

    CLOUD/AWS 2022. 9. 21. 08:46

    [TIL] AWS Athena에서 기존 파티션 drop하고, 신규 파티션 생성 220920

    💡 Today I Learned 요약 (5회차) - AWS Athena에서 파티션이 잘못 생성되었을 경우 alter table을 사용해서 기존 파티션을 삭제하고, 새로운 파티션 생성 가능 AWS Athena에서 기존 파티션 drop하고, 신규 파티션 생성 Athena에서 실수로 파티션을 잘못 생성한 경우(s3 경로를 잘못 입력했다던가 하는 이유로) 기존 파티션을 삭제하고, 신규 파티션을 생성할 수 있음. -- 기존 파티션 삭제 ALTER TABLE {테이블명} DROP IF EXISTS PARTITION ({파티션 키} = {파티션 값}); -- 파티션 키 대체 ALTER table {테이블명} ADD IF NOT EXISTS PARTITION ({파티션 키} = {파티션 값}) LOCATION {s3 ..

    CLOUD/AWS 2022. 9. 20. 10:48

    추가 정보

    인기글

    1. -
      -
      윈도우에서 특정 포트(port)를 사용하는 프로세스 찾기

      2021.05.19 18:17

    2. -
      -
      cmd 배치파일 실행 시 콘솔 창 자동 꺼짐 방지

      2020.09.09 18:42

    3. -
      -
      [AZ-900] 시험 후기 및 공부 방법

      2021.05.16 22:17

    4. -
      -
      소니 WF-1000XM3 이어폰 배터리 교체 후기

      2021.11.07 17:10

    인스타그램

    250x250

    페이징

    이전
    1 2
    다음
    에스프리터🐕 |
    인스타그램

    티스토리툴바