codefortoda / covid19-saitama

埼玉県 新型コロナウイルス感染症対策サイト / Saitama COVID-19 Task Force website
https://saitama.stopcovid19.jp
MIT License
31 stars 22 forks source link

患者の状態別人数表示機能の追加 #49

Open kachine opened 4 years ago

kachine commented 4 years ago

改善詳細 / Details of Improvement

患者のプライバシー保護の観点から https://github.com/codefortoda/covid19-saitama/issues/40 によって患者の状態が判らなくなった。 またNHK報道により、県内に自宅待機状態の患者が相当数存在することが明らかになった。

一方、埼玉県はこれまでに県内で感染が確認された人のうち、医療機関に入院せず、自宅で待機している人が8日午後6時の時点で78人いることを明らかにしました。

https://www3.nhk.or.jp/news/html/20200408/k10012376671000.html?utm_int=news-ranking_social_list-items_007

これらのことから、患者の状態(入院中/退院済/自宅待機中/死亡)を居住地、或いは県全体でサマリした値を表示する機能追加を要望します。

期待する見せ方・挙動 / Expected behavior

居住地 患者の状況 人数
○○市 入院中 3
○○市 退院済 5
××市 自宅待機中 2

※居住地メッシュでの表示もプライバシー保護の観点から不可の場合、居住地列は含めず県全体のサマリ値を表示。

showyou commented 4 years ago

提案頂きありがとうございます。 現在県ともサマった値の出力を依頼していますが、2つの理由により難しそうです。

  1. 患者が一人の地区だと地区全体の値が患者の状態となる
  2. 県の職員が集計している余裕が無い

引き続き交渉進めます。

kachine commented 4 years ago

お忙し中ご回答いただきありがとうございます。 交渉よろしくお願いいたします。

県のOpenDataが更新されない日でも、こちらのrepositoryのdata.jsは更新されていることから察するに、メンテナの方は県職員(またはそれに近い立場の方)であると察しております。すなわち、data.jsを作成するための「一般には非公開の元データ」が存在していることも意味していると考えております。 (見当違いでしたら申し訳ありません)。

この前提であれば、「一般には非公開の元データ」には従来同様(但し、退院だけではなく自宅待機状態も示していただく必要がありますが)患者の状態列を残していただき、こちらのサイトのデータメンテナの方がサマリして公開用データを作成するのであればプライバシー保護の観点からも問題無いかと考えられますが、いかがでしょうか。

サイト運用担当者(データメンテナ)側で集計作業を行えば、保健医療政策課職員の作業負荷は増えずに済むかと思います。 「一般には非公開の元データ」が県OpenDataと同様のCSVファイルであれば、SQLite等を使えば県全体或いは居住地毎に集計するのは容易に実現可能ですので、データメンテナの方の作業負荷が著しく増えるような事態にもならないと考えております。(必要であれば、集計用SQLクエリ等の作成にはcontribute可能でございます。)

よろしくお願いいたします。

showyou commented 4 years ago

メンテナの方は県職員(またはそれに近い立場の方)であると察しております。 data.jsを作成するための「一般には非公開の元データ」が存在している

(パイプがあるのかどうかはわかりませんが、)少なくとも更新しているメンバーは県職員からは遠い存在です。 データも以下のURLにかかれている方法で、殆どお一人で手で更新されています。 https://hackmd.io/MU24UY0oRWyMCbL-h-Ns3w

流石に昨日みたいに30人増加とかになってくると一々更新するのも大変だと思うので、PDFから抽出するスクリプトを私の方で作っていたりはします。 https://github.com/showyou/covid19-saitama/tree/issue-2-crawl-opendata/tool

理想としては県の方にSQLite等システム化を提案して負担を減らしたいのですが、県側のシステム化受け入れ体制がぜんぜん整っていないですね。

codefortoda commented 4 years ago

@kachine 日々のデータ更新は主に私の方で対応しておりますが、県とはパイプはなく、かなり遠い存在と認識しています。

更新元のデータですが、showyouさんが共有された HackMD に記載しておりますが、すべて県ホームページから取得した情報(公開データのみ)になります。

【data.json】
 ・「検査陽性者の状況」については、次のページのデータを転記。
   https://www.pref.saitama.lg.jp/a0701/shingatacoronavirus.html
 ・「陽性患者数」「陽性患者の属性」は次のページにあるPDFからデータ取得。
   https://www.pref.saitama.lg.jp/a0701/covid19/jokyo.html

本来であれば、県のOpenDataが更新されると良いのですが、更新が滞ることが多いため、現時点では県ホームページからの取得で対応しています。

kachine commented 4 years ago

ご回答ありがとうございます。 とんだ見当違いで大変失礼いたしました。

現状では使用データソースが、県HPから手動或いはスクレイピングで生成を試みているような状態とのことですので、県の公開情報が増えない限り実現不可能である旨理解いたしました。

@showyou さんの県との交渉結果次第で、本issueはcloseしていただいて構いません。 お忙しいところ、貴重なお時間割いていただきありがとうございました。