Skip to content

[프로그래머스 프로젝트] 로그 데이터 시각화

Notifications You must be signed in to change notification settings

hyedall/programmers-airflow-ETL

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

programmers-airflow-ETL

로그 데이터 Airflow 파이프라인 구축

PPT
보고서

📊 로그 데이터 Airflow 파이프라인 구축
[로그데이터 분석 대시보드 구축 프로젝트](https://github.com/hyedall/programmers-log-dashboarding/blob/main/README.md) 의 파이프라인을 Airflow로 구축하였습니다.

기술 스택

Airflow, Docker, Postgres

상세 내용

로그 데이터 생성, 적재하는 과정을 Airflow로 자동화함.

  • 하루 간격으로 스케줄링
    • execution_date ~ next_execution_date 까지 시간 별로 데이터 개수가 차이나게 생성 후 로그 데이터 time 걸럼에 넣어줌
    • 날짜 별로도 랜덤 값을 줘서 날짜 별 데이터 양이 다르게 생성
    • Airflow backfill을 활용하여 데이터 생성
  • 증분으로 적재되게 만듬

주요성과

이미지

기여한 부분

에어플로우 dag 작성

배운 점

  • 저번 프로젝트 때 시간별로 같은 분포를 가지는 부분이 아쉬워서 airflow로 데이터를 생성하면서 시간별로 데이터 양이 다르게 생성되게끔 수정해봄
  • airflow를 활용해보면서 full refresh와 증분에 대한 부분도 고민해보고, execution_date에 대해 자세하게 활용해볼 수 있었음

About

[프로그래머스 프로젝트] 로그 데이터 시각화

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Python 98.4%
  • Dockerfile 1.6%