seoyeong200 / Book-data-Pipeline

책 줄거리를 기반으로 비슷한 책을 추천해주는 서비스를 위한 데이터 파이프라인입니다. 도커 환경에서 파이프라인을 구성하여 스파크를 사용해 배치 데이터를 처리합니다.
1 stars 0 forks source link

Refactor : re-structure scraping source code #4

Closed seoyeong200 closed 8 months ago

seoyeong200 commented 9 months ago

Related Issues

2

Descriptions

1. 데이터 수집 코드 리팩토링 - 모듈화

2. 데이터 수집 코드 aws lambda 함수로 재정의

Tests

Screenshots (optional)

Etc. (optional)

seoyeong200 commented 8 months ago

TODO readme에 기술 - aws cli needs to be installed

# needs to be exported
export AWS_REGION=ap-northeast-1
export AWS_ACCESS_KEY_ID=your_access_key
export AWS_SECRET_ACCESS_KEY=your_secret_key
# or just simply follow the instruction
aws configure