codeforjapan / codeforelection

衆院選2017候補者データベース作成プロジェクト This repo will be archived 🗄️ in the future
MIT License
32 stars 6 forks source link

報道データとの確認作業 #47

Closed tetsuyas1 closed 6 years ago

tetsuyas1 commented 6 years ago

作業内容

3_該当なし について

GrayDBには存在したが、報道データでは確認できなかったものが該当

GrayDataになく、報道データで新たに把握した部分

ふりがなについて

higa4 commented 6 years ago

作業お疲れ様です。確定した立候補者はH列(立候補)に「確定」もしくは「立候補」と入れると良いかなと思いますが、 ・842行目までが小選挙区立候補者(重複立候補含む) ・955行目までが比例区立候補者 ・以下は立候補が確認できなかった人 という理解で合っていますでしょうか。

tetsuyas1 commented 6 years ago

@higa4 その理解であってます。"確定" の文字列入力しました。

higa4 commented 6 years ago

ありがとうございます! 報道では立候補者数は1170と言われていますが、数えてみると現在960人なので、あと210人ほど漏れていますか?

tetsuyas1 commented 6 years ago

立候補者(把握漏れシートの中に 報道されたが既存Grayに入ってない 人のリストがあります

higa4 commented 6 years ago

了解です!wikidataへの一括追加用にこのリストは残しつつ、メインの立候補者リストの方にもマージすると良いのかな。合計数が1170より多くなる?

hkwi commented 6 years ago

ふむふむ。完全無所属はすっぽり抜けてるのね。なるほど。

tetsuyas1 commented 6 years ago

そういうことでいいと思います。 なお、ソーシャルアカウントの取得が大量なので #45 を試してみようと思っています。 実用に堪えるかどうかはちょっとお時間ください

hkwi commented 6 years ago

あ、「立候補者(把握漏れ」シートで作業中なのですね。では私のほうでは、とりあえず追加作業は控えておきます(いくつか入れてしまいましたが…)。

tetsuyas1 commented 6 years ago

シート上では作業していただいて問題ないです。 @hkwi 手元で当該人名でBing検索を試しているレベルですので。

higa4 commented 6 years ago

最終的な候補者一覧の整備に際して合計数が把握できるように、現在GrayDBの953行-1052行にある立候補を取り下げた人たちをいったん別シートに逃したいのですが、よろしいですか? →これ、特にコメントが無かったのでこれから手動でやりますね。何かあれば戻せますので言ってください。

higa4 commented 6 years ago

逃しました。これで候補者988人になりました。

hkwi commented 6 years ago

把握漏れをほぼカバーするであろう候補一覧を機械処理で抜き出してみました。

https://github.com/hkwi/shuin48pre/blob/master/docs/gray_to_asahi_missing.csv https://github.com/hkwi/shuin48pre/blob/master/docs/gray_to_mainichi_missing.csv

意外と旧字体とかで重複したりするので、投入するときは、もうひと手間かけないと駄目かもですが、これらは自動ビルドで追跡しています。

朝日との差分のほうが情報を上手く抜き出せてるので、より適切かも。

nyampire commented 6 years ago

GrayDB側で立候補者リストが完成したのでこちらClose