ymym3412 / acl-papers

paper summary of Association for Computational Linguistics
184 stars 10 forks source link

BCSAT : A Benchmark Corpus for Sentiment Analysis in Telugu Using Word-level Annotations #569

Open ymym3412 opened 5 years ago

ymym3412 commented 5 years ago

0. 論文

BCSAT : A Benchmark Corpus for Sentiment Analysis in Telugu Using Word-level Annotations Sreekavitha Parupalli, Vijjini Anvesh Rao and Radhika Mamidi

1. どんなもの?

テルグ語での感情分析向けのデータセット作成とベンチマークの計測

2. 先行研究と比べてどこがすごい?

既存のリソースを活用しつつテルグ語のtokenレベルでの感情分析コーパスを構築した

3. 技術や手法のキモはどこ?

テルグ語での感情分析タスクに向けて、テルグ語のSentiWordNetの単語を使いつつ、Unigram/Bigramでの感情アノテーションを行ったコーパスを作成した

4. どうやって有効だと検証した?

文中に含まれる感情語の+/-の収支による感情予測と、機械学習ベースの感情予測の2種のベースラインを計測した

5. 議論はある?

Bigram素性が重要な特徴量となっていることがわかる

6. 次に読むべき論文は?

ACTSA: Annotated Corpus for Telugu Sentiment Analysis Sandeep Sricharan Mukku and Radhika Mamidi