Open fujiso opened 6 years ago
建設的なコメントか否かの分類の話.明示的にラベル付けされたデータがないので,実サービス上で専門家が選定したコメントを利用する. SVMでF1スコア0.84の分類精度を得られた.
Varada Kolhatkar, Maite Taboada
https://www.sfu.ca/~mtaboada/docs/publications/Kolhatkar_Taboada_EMNLP2017_WS.pdf (emnlp2017のworkshop)
コメントに対して,明示的に建設的か否かのラベル付けされたデータがないので,次のコメントを用いて学習.テストデータはKolhatkarらがクラウドソーシングにて作成.
※ New York Times Picks (NYT Picks)について NYTでは,ニュース記事に対して読者コメントが寄せられるが, そのコメントの中から,代表となるコメントを専門家が選択して,NYT Picksに掲載される(らしい)
※ Yahoo News Anno-tated Comments Corpusについて Yahoo!Newsのコメントのスレッド(議論)に対して,建設的な議論か否かのラベル付けがされているデータセット.関連研究参照
SVMやbiLSTMを用いて二値分類を行う.
SVMの素性は
素性組み合わせたSVMが強い. 文の長さに関する素性が特徴的で, 単体だとTF-IDFに迫るレベルで強いが,他の素性と組み合わせるとF1スコアは下がるらしい.
[1] #3 Constructive language in news comments
[2] Finding Good Conversations Online: The Yahoo News Annotated Comments Corpus http://www.aclweb.org/anthology/W17-0802
[3] Supporting comment moderators in identifying high quality online news comments. http://www.umiacs.umd.edu/~elm/projects/commentiq/commentiq.pdf
New York Times Picksの選定基準を調べたい.何をもって代表コメントとしているのだろうか.
概要
建設的なコメントか否かの分類の話.明示的にラベル付けされたデータがないので,実サービス上で専門家が選定したコメントを利用する. SVMでF1スコア0.84の分類精度を得られた.
著者
Varada Kolhatkar, Maite Taboada
リンク
https://www.sfu.ca/~mtaboada/docs/publications/Kolhatkar_Taboada_EMNLP2017_WS.pdf
(emnlp2017のworkshop)
貢献
手法
コメントに対して,明示的に建設的か否かのラベル付けされたデータがないので,次のコメントを用いて学習.テストデータはKolhatkarらがクラウドソーシングにて作成.
New York Times Picksのコメント
Yahoo News Annotated Comments Corpusの建設的でないスレッドの中のコメント
※ New York Times Picks (NYT Picks)について
NYTでは,ニュース記事に対して読者コメントが寄せられるが, そのコメントの中から,代表となるコメントを専門家が選択して,NYT Picksに掲載される(らしい)
※ Yahoo News Anno-tated Comments Corpusについて
Yahoo!Newsのコメントのスレッド(議論)に対して,建設的な議論か否かのラベル付けがされているデータセット.関連研究参照
実験
SVMやbiLSTMを用いて二値分類を行う.
SVMの素性は
結果
素性組み合わせたSVMが強い. 文の長さに関する素性が特徴的で, 単体だとTF-IDFに迫るレベルで強いが,他の素性と組み合わせるとF1スコアは下がるらしい.
Future work
関連研究
[1] #3 Constructive language in news comments
[2] Finding Good Conversations Online: The Yahoo News Annotated Comments Corpus http://www.aclweb.org/anthology/W17-0802
[3] Supporting comment moderators in identifying high quality online news comments. http://www.umiacs.umd.edu/~elm/projects/commentiq/commentiq.pdf