Open ymym3412 opened 5 years ago
SemAxis: A Lightweight Framework to Characterize Domain-Specific Word Semantics Beyond Sentiment Jisun An† Haewoon Kwak† Yong-Yeol Ahn§
扱うコーパスのドメインに応じたsentimentのスコアを計算する手法
Word EmbeddingsとConceptNetを利用してシンプルにsentimentスコアを計算できる
対極の意味のベクトルの減算によって意味のaxis vectorを得ることができ、これは特定の意味の変化の軸を表すベクトルである。 特定のドメインのword embeddingsを用意し、ConceptNetから意味の対義語のペアを抽出し、そこからaxis vectorを計算し、特定の単語ベクトルとaxis vectorとのコサイン類似度を取ることでその単語の意味のスコアを取る手法を提案。 これを利用して特定のドメインにおける感情のスコアを計算してsentiment classificationを解く
Stanford English, Twitterコーパスを利用して検証した。
ドメインごとに単語の特定のaxisに対するスコアの変化をうまく捉えられている
ConceptNet 5.5: An Open Multilingual Graph of General Knowledge Robyn Speer, Joshua Chin, Catherine Havasi
0. 論文
SemAxis: A Lightweight Framework to Characterize Domain-Specific Word Semantics Beyond Sentiment Jisun An† Haewoon Kwak† Yong-Yeol Ahn§
1. どんなもの?
扱うコーパスのドメインに応じたsentimentのスコアを計算する手法
2. 先行研究と比べてどこがすごい?
Word EmbeddingsとConceptNetを利用してシンプルにsentimentスコアを計算できる
3. 技術や手法のキモはどこ?
対極の意味のベクトルの減算によって意味のaxis vectorを得ることができ、これは特定の意味の変化の軸を表すベクトルである。 特定のドメインのword embeddingsを用意し、ConceptNetから意味の対義語のペアを抽出し、そこからaxis vectorを計算し、特定の単語ベクトルとaxis vectorとのコサイン類似度を取ることでその単語の意味のスコアを取る手法を提案。 これを利用して特定のドメインにおける感情のスコアを計算してsentiment classificationを解く
4. どうやって有効だと検証した?
Stanford English, Twitterコーパスを利用して検証した。
5. 議論はある?
ドメインごとに単語の特定のaxisに対するスコアの変化をうまく捉えられている
6. 次に読むべき論文は?
ConceptNet 5.5: An Open Multilingual Graph of General Knowledge Robyn Speer, Joshua Chin, Catherine Havasi