Closed Eom-taeseon closed 3 years ago
2021년 1월부터 네이버 금융에서 User-agent 정보가 없는 웹 스크레이핑을 차단했기 때문에 팬더스의 read_html() 함수를 사용할 때에도 기존처럼 단순히 URL만 인자로 넘겨줘서는 안 되고 아래처럼 requests.get() 함수로 읽은 전체 HTML 텍스트를 인자로 넘겨줘야 합니다.
변경 전
df = df.append(pd.read_html(page_url, header=0)[0])
변경 후
df = df.append(pd.read_html(requests.get(page_url , headers={'User-agent': 'Mozilla/5.0'}).text)[0])
문제 해결 됐습니다. 감사합니다 :)
p.s. 194쪽의 목차가 오타난 것 같습니다. 4.5.3 셀트리온 캔들 차트로 씌어져야할 것 같은데 4.4.3 셀트리온 캔들 차트라고 써져있네요.
알려주신대로 4.5.3 셀트리온 캔들 차트로 표시되는 게 맞습니다. 다음 인쇄(5쇄)에서 수정하겠습니다.
4.4.4장 전체 페이지 읽어오기에서
이 부분에서 아래와 같은 오류가 뜹니다.
어떻게 해결하면 좋을까요?