Open jy617lee opened 6 years ago
https://github.com/xotrs/naver-blog-crawler 의 크롤러 사용 시도
--> 401 unauthorized 에러 해결중 --> 검색 기간을 설정할 수 없는 문제가 있음
https://gist.github.com/allieus/614c732941b3e3725b595f787a1efc57#file-crawl_naver_blog-py 크롤러 사용 시도
--> 특정 블로그의 모든 포스팅을 긁어오는 크롤러로 --> 검색어와 검색기간을 설정해와야 하는 우리의 요구사항과는 맞지 않음
https://developers.naver.com/products/search/ 네이버 검색 api 등록 시도중
https://github.com/dataitgirls2/m3/commit/14d36cd0f58ee90f2e2abe27c21ef190cb567c3a
[완료]
[tbd]
엑셀로 저장하는 코드입니다 @HeeYoungK 참고해주세요!
import xlwt wb = xlwt.Workbook() ws = wb.add_sheet('nanohana_title') ws.write(titles) wb.save('C:/dateGirls/m3/example.xls')
오전에 한 것
완료 코드 : https://github.com/jy617lee/naver_blog_crawler 결과물 : 나노하나 검색어에 대한 두달 치 블로그 포스팅 크롤러 결과를 공용드라이브 raw_data 폴더에 업로드 해두었습니다.