magicpieh28 / Paper-Summary

1 stars 0 forks source link

Word clustering based on POS feature for efficient twitter sentiment analysis(2018) #12

Open magicpieh28 opened 5 years ago

magicpieh28 commented 5 years ago

about this paper

Author: Yili Wang, Kyung Tae Kim, ByungJun Lee, Hee Yong Youn Link: https://link.springer.com/content/pdf/10.1186%2Fs13673-018-0140-y.pdf

品詞タグによるタグ済み訓練データセットの識別可能性や単語の依存性はクラスタリングや重みプロセスにおいて重要な役割を果たす。 ツイートの感情分析のためのChi Square-based feature clusteringを少し変更した手法と重みスキームを提案する。

提案手法は、クラスの中の品詞特徴の同じ単語はあらかじめ定義されたセットに群衆化される。群衆化されたセットとこれに当てはまるクラス間の依存性はChi Square手法により計測される。 多項式のNaive Bayes modelは無駄な特徴を処理するため持ち込み、感情的単語は精度を上げるために使われた。 提案手法はSentiment 140を対象に実験した結果、最も良い性能を見せた。

next

https://pdfs.semanticscholar.org/ec22/968ae4da050d435e47982b39d736b47e0507.pdf

magicpieh28 commented 5 years ago

Chi Square-based feature clustering

https://ko.wikipedia.org/wiki/%EC%B9%B4%EC%9D%B4%EC%A0%9C%EA%B3%B1_%EA%B2%80%EC%A0%95 https://www.geeksforgeeks.org/ml-chi-square-test-for-feature-selection/ https://www.linkedin.com/pulse/chi-square-feature-selection-python-md-badiuzzaman-biplob