Open ymym3412 opened 5 years ago
BCSAT : A Benchmark Corpus for Sentiment Analysis in Telugu Using Word-level Annotations Sreekavitha Parupalli, Vijjini Anvesh Rao and Radhika Mamidi
テルグ語での感情分析向けのデータセット作成とベンチマークの計測
既存のリソースを活用しつつテルグ語のtokenレベルでの感情分析コーパスを構築した
テルグ語での感情分析タスクに向けて、テルグ語のSentiWordNetの単語を使いつつ、Unigram/Bigramでの感情アノテーションを行ったコーパスを作成した
文中に含まれる感情語の+/-の収支による感情予測と、機械学習ベースの感情予測の2種のベースラインを計測した
Bigram素性が重要な特徴量となっていることがわかる
ACTSA: Annotated Corpus for Telugu Sentiment Analysis Sandeep Sricharan Mukku and Radhika Mamidi
0. 論文
BCSAT : A Benchmark Corpus for Sentiment Analysis in Telugu Using Word-level Annotations Sreekavitha Parupalli, Vijjini Anvesh Rao and Radhika Mamidi
1. どんなもの?
テルグ語での感情分析向けのデータセット作成とベンチマークの計測
2. 先行研究と比べてどこがすごい?
既存のリソースを活用しつつテルグ語のtokenレベルでの感情分析コーパスを構築した
3. 技術や手法のキモはどこ?
テルグ語での感情分析タスクに向けて、テルグ語のSentiWordNetの単語を使いつつ、Unigram/Bigramでの感情アノテーションを行ったコーパスを作成した
4. どうやって有効だと検証した?
文中に含まれる感情語の+/-の収支による感情予測と、機械学習ベースの感情予測の2種のベースラインを計測した
5. 議論はある?
Bigram素性が重要な特徴量となっていることがわかる
6. 次に読むべき論文は?
ACTSA: Annotated Corpus for Telugu Sentiment Analysis Sandeep Sricharan Mukku and Radhika Mamidi