fujiso / papers

NLP/Deep Learning関連の論文まとめ
4 stars 0 forks source link

Using New York Times Picks to Identify Constructive Comments, EMNLP2017 #9

Open fujiso opened 6 years ago

fujiso commented 6 years ago

概要

建設的なコメントか否かの分類の話.明示的にラベル付けされたデータがないので,実サービス上で専門家が選定したコメントを利用する. SVMでF1スコア0.84の分類精度を得られた.

著者

Varada Kolhatkar, Maite Taboada

リンク

https://www.sfu.ca/~mtaboada/docs/publications/Kolhatkar_Taboada_EMNLP2017_WS.pdf
(emnlp2017のworkshop)

貢献

手法

コメントに対して,明示的に建設的か否かのラベル付けされたデータがないので,次のコメントを用いて学習.テストデータはKolhatkarらがクラウドソーシングにて作成.

※ New York Times Picks (NYT Picks)について
NYTでは,ニュース記事に対して読者コメントが寄せられるが, そのコメントの中から,代表となるコメントを専門家が選択して,NYT Picksに掲載される(らしい)

※ Yahoo News Anno-tated Comments Corpusについて
Yahoo!Newsのコメントのスレッド(議論)に対して,建設的な議論か否かのラベル付けがされているデータセット.関連研究参照

実験

SVMやbiLSTMを用いて二値分類を行う.

SVMの素性は

shot

結果

素性組み合わせたSVMが強い. 文の長さに関する素性が特徴的で, 単体だとTF-IDFに迫るレベルで強いが,他の素性と組み合わせるとF1スコアは下がるらしい. 2018-07-17 17 29 35

Future work

関連研究

[1] #3 Constructive language in news comments

[2] Finding Good Conversations Online: The Yahoo News Annotated Comments Corpus http://www.aclweb.org/anthology/W17-0802

[3] Supporting comment moderators in identifying high quality online news comments. http://www.umiacs.umd.edu/~elm/projects/commentiq/commentiq.pdf

fujiso commented 6 years ago

New York Times Picksの選定基準を調べたい.何をもって代表コメントとしているのだろうか.