AkihikoWatanabe / paper_notes

たまに追加される論文メモ
https://AkihikoWatanabe.github.io/paper_notes
17 stars 0 forks source link

The LIA Update Summarization Systems at TAC-2008, Boudin et al. TAC’08 #33

Open AkihikoWatanabe opened 6 years ago

AkihikoWatanabe commented 6 years ago

https://www.researchgate.net/publication/231520992_The_LIA_Update_Summarization_system_at_TAC-2008

AkihikoWatanabe commented 6 years ago

・Scalable MMR #32 とVariable length intersection gap n-term modelを組み合わせる. ・Variable length intersection gap n-term modelは,あるトピックのterm sequenceは他の異なる語と一緒にでてくる?という直感にもとづく.要は,drugs.treat.mental.*illnessなどのパターンをとってきて活用する.このようなパターンをn-gram, n-stem, n-lemmaごとにつくり3種類のモデルを構築.この3種類のモデルに加え,coverage rate (topic vocabularyがセグメント内で一度でもみつかる割合)とsegmentのpositionの逆数を組みあわせて,sentenceのスコアを計算(先頭に近いほうが重要). ・coherenceを担保するために,sentenceを抽出した後,以下のpost-processingを行う.

Acronym rewriting(初めてでてくるNATOなどの頭字語はfull nameにする) Date and number rewriting(US standard formsにする) Temporal references rewriting (next yearなどの曖昧なreferenceを1993などの具体的なものにする) Discursive form rewriting (いきなりButがでてくるときとかは削るなど) カッコやカギカッコは除き,句読点をcleanedする

・TAC 2008におけるROUGE-2の順位は72チーム中32位