Faithful to the Original: Fact Aware Neural Abstractive Summarization, AAAI2018

fujiso commented 6 years ago

概要

ファクト抽出(OpenIEや構文解析)を用いて，元テキストへの忠実性を考慮する生成型の要約モデルを提案．元テキストからファクトを抽出して要約生成に活用することで，ニューラル生成要約モデルにありがちな嘘情報を含んでしまう問題点の解消に取り組んでいる．提案法で嘘情報を含む要約の出現率を27%から6%に削減．

著者

Ziqiang Cao, Furu Wei, Wenjie Li, Sujian Li The Hong Kong Polytechnic University, Microsoft Research

リンク

https://arxiv.org/abs/1711.04434

貢献

生成型要約のFact忠実性について初めて取り組んだ
抽出したファクトも入力できるencoder-decoderモデルを提案
ファクトは元テキスト意味が凝縮されていることが多いため，生成された要約のROUGEも大きく向上

手法

前処理

OpenIEにより(主語，述語，目的語)の3つ組をfactとして抽出． OpenIEでfactを抽出できない文(コーパスの15%ほど)は，構文解析にかけて抽出.

モデル

文のencoderとfactのencoderの二つのbi-GRUを用意． factのencoderには前処理で抽出したfactを"fact1 ||| fact2"のように|||で連結して一つのseqenceにして入力．両方のencoderについてattentionを計算して，MLPで合わせてcontext vectorにしている．