Closed daisuke19891023 closed 4 years ago
患者情報スクレイピングできました https://imabari.hateblo.jp/entry/2020/06/11/165653
@imabari ありがとうございます!ブログのコードを参考にしたら患者情報のスクレイピングが出来るようになりました!
60件までのpatientsからpatients_summaryを作るとdata.jsonとの差が多いのですが原因わかりますか? https://github.com/covid19-yamanashi/covid19/blob/development/data/data.json
patients_summaryはこちらで作成 https://github.com/imabari/covid19-data/blob/master/yamanashi/main.py
フォーマット変更が発生するまでは、patientsとpatients_summaryで利用する日付項目にずれがありました
data.json
とのずれが発生してしまいます。
リリース日と発生判明日のどちらを利用するべきかを現在本家のIssueとして確認しています。
https://github.com/covid19-yamanashi/covid19/issues/80承知しました リリース日より発生判明日の方に変更しているところが多いですね 山梨県のデータは変換するのが難しいのでPDFのときは途中でやめました
data.jsonのpatientsの4/16に「山」と「女」が文字コードが違う漢字が入ってます
divで囲われていない素のhtmlからテキスト読み取りを行う