Open ibadora opened 6 years ago
http://www.aclweb.org/anthology/K16-1028 扱うタスクは文要約,文書要約の2つ. Encoder-decoderを用いた生成型文要約モデルに品詞、固有表現、TF、IDFなどの素性を組み込むモデルを提案。 また、LSTMを階層的に構築する生成型文書要約モデルを提案。
Ramesh Nallapati, Bowen Zhou, Cicero dos Santos, Çag ̆lar Gu ̇lçehre and Bing Xiang IBM Watson
いろいろな素性を組み込んだEncoder-decoder文要約器 単語の品詞タグembeddingなどをconcatすることで,表層的な情報だけではなく単語の品詞や意味情報も考慮する文要約モデル.
文書要約モデル 入力文書を文分割し文ごとに文ベクトルを生成.デコード時には入力の単語ベクトルと文ベクトルにAttentionスコアを計算しながら出力単語を決定する.
文要約: DUCデータセット 文書要約: CNN/Dailyデータセット
品詞などの素性を加えると性能が向上した. 階層的な文書要約モデルでベースラインを上回ったが,抽出にはまだ勝てない.
概要
http://www.aclweb.org/anthology/K16-1028 扱うタスクは文要約,文書要約の2つ. Encoder-decoderを用いた生成型文要約モデルに品詞、固有表現、TF、IDFなどの素性を組み込むモデルを提案。 また、LSTMを階層的に構築する生成型文書要約モデルを提案。
著者
Ramesh Nallapati, Bowen Zhou, Cicero dos Santos, Çag ̆lar Gu ̇lçehre and Bing Xiang IBM Watson
手法
いろいろな素性を組み込んだEncoder-decoder文要約器 単語の品詞タグembeddingなどをconcatすることで,表層的な情報だけではなく単語の品詞や意味情報も考慮する文要約モデル.
文書要約モデル 入力文書を文分割し文ごとに文ベクトルを生成.デコード時には入力の単語ベクトルと文ベクトルにAttentionスコアを計算しながら出力単語を決定する.
実験設定・使用データ
文要約: DUCデータセット 文書要約: CNN/Dailyデータセット
結果
品詞などの素性を加えると性能が向上した. 階層的な文書要約モデルでベースラインを上回ったが,抽出にはまだ勝てない.