Open hunkim opened 8 years ago
혹시 CSV를 만들때 link를 잘못가져올 가능성도 있는지 모르겠습니다.
한 예로 bill_id: 1907716 link_id: PRC_L1Y3E1E1Q1F2O1P8Z2C5N4H9T1E5I9
의안 시스템에서 bill_id로도 검색이 가능한가요?
http://likms.assembly.go.kr/bill/jsp/BillDetail.jsp?bill_id=PRC_E1O4I0W4F2D5L1G0D3S6M3N5V3X3Q4 에 해당하는 의안번호를 찾아보니 1910298 번입니다. http://ko.pokr.kr/bill/1910298
1910298번은 http://likms.assembly.go.kr/bill/jsp/BillDetail.jsp?bill_id=PRC_L1L4I0L4D2V5A1K8O0H6L4R9Z3U5C3
동일한 발의인의 의안은 1910299호 http://likms.assembly.go.kr/bill/jsp/BillDetail.jsp?bill_id=PRC_Z1L4L0V4S2O5N1O0B5V6F2V4Q4M5L7
동일한 제안내용의 법안은 아직 못찾았습니다. 위 내용을 보건데 csv가 잘못 crawling 된것으로 보입니다.
내용으로 보건데 1900491호가 비슷해보입니다.
웹에서 뒤지다 보니 의안번호로 검색할 수 있는 시스템을 찾았습니다. https://www.lawmaking.go.kr/opnPtcp/nsmLmSts/out
국회의안정보시스템
해당 항목 주위는 정상적으로 보입니다. 크롤러 버그인지 국회사이트 버그인지는 모르겠습니다. 로컬에서 csv생성해보는 중입니다.
로컬에서 크롤링한 19.csv 를 확인해보았습니다.
1910298 번이 공직자 윤리법항목으로 정상적으로 크롤링 되었습니다. 잘 보면 뒤쪽 항목이 업데이트 된 걸 알 수 있습니다. github에 올라가있는 파일과 달라보입니다.
일부 법안에 대해 다음과 같은 에러가 나는데. CSV목록에는 있는데 법안 detail은 정보가 없다고 나옵니다.
http://likms.assembly.go.kr/bill/jsp/BillDetail.jsp?bill_id=PRC_E1O4I0W4F2D5L1G0D3S6M3N5V3X3Q4
이런경우 현재 html2json에서는 IndexError exception을 내는데 따로 처리 해주는 것이 좋지 않을까요?