ibadora / summarization_papers

要約論文をまとめるリポジトリです。
3 stars 0 forks source link

Abstractive Text Summarization Using Sequence-to-Sequence RNNs and Beyond, Nallapati+, CoNLL2016 #2

Open ibadora opened 6 years ago

ibadora commented 6 years ago

概要

http://www.aclweb.org/anthology/K16-1028 扱うタスクは文要約,文書要約の2つ. Encoder-decoderを用いた生成型文要約モデルに品詞、固有表現、TF、IDFなどの素性を組み込むモデルを提案。 また、LSTMを階層的に構築する生成型文書要約モデルを提案。

著者

Ramesh Nallapati, Bowen Zhou, Cicero dos Santos, Çag ̆lar Gu ̇lçehre and Bing Xiang IBM Watson

手法

  1. いろいろな素性を組み込んだEncoder-decoder文要約器 2017-12-09 5 45 39 単語の品詞タグembeddingなどをconcatすることで,表層的な情報だけではなく単語の品詞や意味情報も考慮する文要約モデル.

  2. 文書要約モデル 2017-12-09 5 41 48 入力文書を文分割し文ごとに文ベクトルを生成.デコード時には入力の単語ベクトルと文ベクトルにAttentionスコアを計算しながら出力単語を決定する.

実験設定・使用データ

文要約: DUCデータセット 文書要約: CNN/Dailyデータセット

結果

品詞などの素性を加えると性能が向上した. 階層的な文書要約モデルでベースラインを上回ったが,抽出にはまだ勝てない.