magicpieh28 / Paper-Summary

1 stars 0 forks source link

Word Embeddings for Sentiment Analysis: A Comprehensive Empirical Survey(2019) #11

Open magicpieh28 opened 5 years ago

magicpieh28 commented 5 years ago

about this paper

Author: Erion Cano, Maurizio Morisio Link: https://arxiv.org/pdf/1902.00753.pdf

ツイッター・歌の歌詞・映画レビューなどの感情分析での単語Embeddingの性能を、訓練手法・訓練コーパスサイズ・テーマごとの関係性などの要素ごとにその影響力を調べた研究。 単語類推(word analogy)研究においてGloVe・Word2Vecの性能を図るための研究。 感情分析や似た文書を探索するタスクを持って研究を行なっている研究者たちにガイドラインが示せられると思う。

questions

related works

experiments

datasets

本論文のTable1を参照

preprocessing

settings

discussion

means of lexiconsや特定訓練手法はより性能のいい単語embeddingsを生成できる。 単語類推タスクにおいて最もいい性能を見せたのは:multi multi-thematicのテキストコーパスを用いたモデルでの実験であった。

conclusion

いくつかのテーマを持っているテキストで訓練したモデルは、豊富な辞書を生成するので、構文論的・意味論的単語の比喩問題に最もいい結果を示した。 感情分析タスクにおいて、訓練手法と訓練コーパスサイズの間には強い関連性があることがわかったが、訓練コーパスのテーマがどんなものなのかとはあまり関連性がないことがわかった。

code

http://softeng.polito.it/erion/