Open simonjisu opened 5 years ago
오류를 확인해 주셔서 감사합니다. beautifulsoup4 버전이 의심스러워 확인해보니 이 문제였습니다.
제가 작업할 때 이용한 beautifulsoup4 의 버전은 4.6.0 입니다. 여기에서는 href^= 다음의 값 앞, 뒤에 "
를 넣어도 넣지 않아도 동일하게 작동하는데, 4.7.x 에서는 이 부분이 바뀐 듯 합니다. 반드시 "
를 입력해야만 작동을 하네요.
최근 버전에서 "
를 넣어야만 작동하고, 4.6.x 에서도 동일하게 작동하니, 해당 코드로 수정하도록 하겠습니다.
이슈와 해결 방법을 상세히 알려주셔서 감사합니다. 덕분에 수월하게 버그를 잡을 수 있었습니다!!
안녕하세요! 오류가 좀 있어서 해결하다가 이슈를 남기게 되었습니다.
환경:
실행파일
오류 설명
search_crawler.py
파일에서_parse_urls_from_page
함수에서 에러가 났었는데요,article_blocks
라는 변수(bs4.element.Tag
객체)가 pattern 을 인식못하는 현상이 발생했습니다. 그래서 각 패턴 string 중 링크 앞뒤에 " " 를 붙이니까 해결이 되었습니다.('a[href=https://news.naver.com/main/read.nhn?]'
('a[href="https://news.naver.com/main/read.nhn?"]'
PS: 저만 그런지 모르겠지만, 다른 분들도 오류가 나면 참고 부탁드립니다. :)
오류상세