strange-study / ss-spark

스팤 스터디 ✨
4 stars 2 forks source link

[Project] python 기반 웹 스크래퍼 #45

Open minSW opened 3 years ago

minSW commented 3 years ago

자세한 내용은 #43 참고

사용 방법

❯ python3 dc_scraper.py
[ERROR] 'gallary_id' argument is required.

usage: python3 dc_scraper.py [gallary_id]
example: python3 dc_scraper.py programming (https://gall.dcinside.com/board/lists?id=programming)
❯ python3 dc_scraper.py programming
Save to 'output/20210620/programming.csv'
scraping... page - 1
scraping... page - 2
scraping... page - 3
scraping... page - 4
scraping... page - 5
scraping... page - 6
scraping... page - 7
scraping... page - 8
scraping... page - 9
scraping... page - 10
scraping... page - 11
scraping... page - 12
scraping... page - 13
scraping... page - 14
scraping... page - 15
--------------------------
SCRAPED PAGES : 1 ~ 15
[END] TOTAL TIME :  0:00:03.762457

스크립트

기타 참고사항

ChoMk commented 3 years ago

핫겔 100위 크롤링 연결 작업을 해당 pr 브랜치( project/#43) 타겟으로 작업 진행하고 제 pr이 project/#43으로 머지되면 그때 세원님 리뷰 같이 진행하시죠 ㅎㅎ

minSW commented 3 years ago

@ChoMk @jin5335 에러 대응 및 2021.07.02 오전 0시 기준 데이터 압축하여 output_210702.zip 으로 업로드하였습니다~!

변경사항