wangqiangneu / MT-PaperReading

Record my paper reading about Machine Translation and other related works.
36 stars 2 forks source link

19-NIPS-Fast Structured Decoding for Sequence Models #35

Open wangqiangneu opened 5 years ago

wangqiangneu commented 5 years ago

简介

CRF引入到NAT中. 之前的大部分工作,都是在decoder的输入端做文章,搞各种确定性的或latent的z帮助译文生成. 这篇的idea是把CRF做sequence labeling的思路引过来,因为NAT一个很明显的问题就是相邻词之间很容易repeat,很适合CRF中的transition matrix的发挥。也就是说在生成译文时,除了考虑每个位置的score外,还要考虑label之间的transition的情况,自然就消灭了很多明显译文有问题的情况。但是naive的transition matrix很大(V x V),没法搞,就做了low-rank和beam pruning近似,最后又可以根据相邻位置的hidden state动态生成transition matrix. 做法很自然

论文信息

总结