codeforjapan / codeforelection

衆院選2017候補者データベース作成プロジェクト This repo will be archived 🗄️ in the future
MIT License
32 stars 6 forks source link

wikidataへのデータ登録再開に向けた方針検討 #61

Closed tetsuyas1 closed 6 years ago

tetsuyas1 commented 7 years ago

=====

しばらく止めていたwikidataへのデータ登録を再開するために、GrayDBにあるものをできるだけ活かしつつ、二重登録や不整合を極力抑えるために作戦を立てたいと思います。案を考えてみましたのでご意見お願いします。

1 GrayDBから転記するもの

1.1 wikidataにほぼ未登録で、問題が少なさそうなもの →そのままQS2などで一括登録 ・選挙区 ・公認政党 ・47th House of Representativesなど(命名をどうするか検討中)

1.2 wikidataにある程度登録済みでかつGrayDBの文字列をそのまま登録するもの →GrayDBの登録内容のうち、wikidataに入っていない差分を取ってから未登録分を一括登録 ・選挙用表記名 ・かな ・誕生日 ・写真 ・twitter ・facebook ・LINE ・youtube channel ・instagram ・公式サイト ・メールアドレス ・公式ブログ ・詳細情報URL

1.3 wikidataにある程度登録済みでかつGrayDBの文字列をQ番号に置き換えて登録するもの(置き換え数の少ないもの) →GrayDBの登録内容のうち、wikidataに入っていない差分を取ってから未登録分を一括登録 ・性別

1.4 wikidataにある程度登録済みでかつGrayDBの文字列をQ番号に置き換えて登録するもの(置き換え数の多いもの) →手作業で登録 ・出生地 ・立候補歴 ・当選歴 ・学歴 ・職歴 ・公職 ・父親 ・配偶者

2 GrayDB以外のネット上から収集して手作業で登録 →広く作業支援を呼びかける

3 データのupdate ・botを仕込む?

4 当選後に向けた準備 ・何をしましょうかね?

takahashim commented 6 years ago

「議会開催期」についてですが、 http://tinyurl.com/y8vgpgfo のクエリで見た結果では、どうも普通に国会の会期と結びついているようなので、ここは抜本的に何とかしないと解決しなさそうに思えました…。 こういうのの議論ってWikidataではどこでやってるんでしょうか。

takahashim commented 6 years ago

あー、でも最近の国会は、「議会開催期 (Q15238777)」ではなく「立法期制 (Q1812889)」で、立法期制は議会開催期の一部(part of, P361)になってるんですね…。 じゃあこれは国会が直接議会開催期に紐ついているのが要修正なのかも。

takahashim commented 6 years ago

「議会開催期」ですが、内閣が総辞職すると衆議院を解散しなくても次の内閣に代わってしまうので、議会開催期とずれてしまいますよね。 やはり議会開催期と内閣を紐つけるのはやはり適切ではないのではないでしょうか。

higa4 commented 6 years ago

あー、でも最近の国会は、「議会開催期 (Q15238777)」ではなく「立法期制 (Q1812889)」で、立法期制は議会開催期の一部(part of, P361)になってるんですね…。 じゃあこれは国会が直接議会開催期に紐ついているのが要修正なのかも。

「立法期制」 (Q1812889)は第n会国会 http://www.shugiin.go.jp/internet/itdb_annai.nsf/html/statics/shiryo/kaiki.htm に対応する概念で、日本では「国会会期」というラベルに変えた方が良いかもしれませんね。 現在、例えば「第136回国会」 (Q10885874)の分類に議会開催期 (Q15238777)が当てられているのは間違いで、「立法期制」 (Q1812889)に修正する必要があると思います。

higa4 commented 6 years ago

「議会開催期」ですが、内閣が総辞職すると衆議院を解散しなくても次の内閣に代わってしまうので、議会開催期とずれてしまいますよね。 やはり議会開催期と内閣を紐つけるのはやはり適切ではないのではないでしょうか。

「議会開催期」(Q15238777)はイギリスにはあるけど日本には元々無い概念で衆議院総選挙から次の衆議院総選挙までの(複数の)国会開催期間を指しています。日本ではこれにn番目の開催期間の名前ではなく、「第n次◯◯内閣」という内閣を指す名称が付けられているので、(英語ラベルは変えずに)日本語ラベルにはその名前を当ててはどうか、というのが私の意見です。 ただし、ウィキペディアでは「第n次◯◯内閣」は内閣改造ごと(第n次改造)に別の記事になっていて、全体を通した「第n次◯◯内閣」の記事が無いのでwikipediaとwikidataの対応付けが混乱しそう、というのが懸念点です。

takahashim commented 6 years ago

いえ、内閣改造ではなく内閣総辞職の場合です。 例えば、Term for House of Representatives 45th general election https://www.wikidata.org/wiki/Q41806822 の内閣は鳩山由紀夫内閣・菅内閣・野田内閣(〜第3次改造内閣)にまたがると思うのですが、Wikidataの日本語ラベルではどういう名前になるのでしょうか?

higa4 commented 6 years ago

対象となる内閣の組閣/改造は以下のとおりです。そうかー。内閣総辞職後に必ずしも総選挙があるわけじゃないんですね。下記をまとめると「鳩山由紀夫・菅・野田内閣」という名前になりますが、どうでしょうか。そんな名前は一般的に使われていないのでボツですね。やはりラベルは英語名を使って、内閣名は使うにしても説明欄で表現するくらいですかね。

  1. 鳩山由紀夫内閣 2009/9/16-2010/6/8 https://ja.wikipedia.org/wiki/%E9%B3%A9%E5%B1%B1%E7%94%B1%E7%B4%80%E5%A4%AB%E5%86%85%E9%96%A3
  2. 菅内閣 2010/6/8-2010/9/17 https://ja.wikipedia.org/wiki/%E8%8F%85%E5%86%85%E9%96%A3
  3. 菅内閣(第1次改造)2010/9/17-2011/1/14 https://ja.wikipedia.org/wiki/%E8%8F%85%E5%86%85%E9%96%A3(%E7%AC%AC1%E6%AC%A1%E6%94%B9%E9%80%A0)
  4. 菅内閣 (第2次改造)2011/1/14-2011/9/2 https://ja.wikipedia.org/wiki/%E8%8F%85%E5%86%85%E9%96%A3_(%E7%AC%AC2%E6%AC%A1%E6%94%B9%E9%80%A0)
  5. 野田内閣 2011/9/2-2012/1/13 https://ja.wikipedia.org/wiki/%E9%87%8E%E7%94%B0%E5%86%85%E9%96%A3
  6. 野田内閣 (第1次改造)2012/1/13-2012/6/4 https://ja.wikipedia.org/wiki/%E9%87%8E%E7%94%B0%E5%86%85%E9%96%A3_(%E7%AC%AC1%E6%AC%A1%E6%94%B9%E9%80%A0)
  7. 野田内閣 (第2次改造)2012/6/4-2012/10/1 https://ja.wikipedia.org/wiki/%E9%87%8E%E7%94%B0%E5%86%85%E9%96%A3_(%E7%AC%AC2%E6%AC%A1%E6%94%B9%E9%80%A0)
  8. 野田内閣 (第3次改造)2012/10/1-2012/12/26 https://ja.wikipedia.org/wiki/%E9%87%8E%E7%94%B0%E5%86%85%E9%96%A3_(%E7%AC%AC3%E6%AC%A1%E6%94%B9%E9%80%A0)
takahashim commented 6 years ago

そうなりますよね…。やっぱり「ラベルは英語名」で良いかと思います。

nyampire commented 6 years ago

別のIssueに乗り換えたほうがよさそう。