codeforjapan / codeforelection

衆院選2017候補者データベース作成プロジェクト This repo will be archived 🗄️ in the future
MIT License
32 stars 6 forks source link

Bing APIからSNSアカウントを取得するスクリプト追加 Fixed. #45 #48

Closed tetsuyas1 closed 6 years ago

tetsuyas1 commented 6 years ago

APIにうまくアクセスできない。こまったな(こなみ) なお、有料のBingアカウントが必要です。 使いたい方は、dotenvモジュールの使い方を参照してください。 具体的には下記のようなことをします。 .envファイルをプロジェクトのrootに配置し、下記を記載する。

AZULE_BING_SEARCH_API_KEY_1=aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa
AZULE_BING_SEARCH_API_KEY_2=xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx
tetsuyas1 commented 6 years ago

途中ですがひとまず煮詰まってるのでPRにします。

tetsuyas1 commented 6 years ago

https://github.com/tetsuyas1/codeforelection/blob/2ddd0de17354e8d2e375819db1ad9f14263ef73c/data/graydb/haaku_sns.sjis.csv こちらが、新しくメディア報道から確認された候補者について、 BingAPIを使って、名前でSNSのアカウントを抽出したの検索結果になります。 今ひとつ結果が不安定ですが、Bingのトップページから検索しても微妙な結果が出てくるので、 そういうものなのかなと勝手に考えております。

なお、スクリプトの実行には有料のKey(初回無料分を使うこともできる)が必要です。

結果のcsvですが、 各政治家について、検索結果の3件つづをTwitter,FBの順に掲載しています。 また検索結果毎に、検索リンクタイトル、検索リンク、スニペット、抽出されたアカウントなどを配置してあります。 その中で使えそうなものを選んでいただく感じになります。

取り急ぎ。

tetsuyas1 commented 6 years ago

リファクタリングしました。

結果のつかい方

haaku_sns_results.sjis.csvをエクセル等で開いてください。 名前から検索したアカウント推定の検索結果がE列にあります。 H列にスニペットがありますので、検索結果から正しいと思われるものを選んで、 GrayDB、又は把握漏れシート状に にコピペするなどして反映することができると思います。 A列は把握もれシートひらがなkeyを残してあるので、 Excelに詳しい方はマージをlookupか何かで書くことができると思います。