Open IkokObi opened 5 years ago
記法について
L_max
transformerの入力となる1つのsequenceをsegmentと呼ぶ
1つ前のsegmentの隠れ状態を次のsegmentにreccurent的に渡す
式として表すと次のようになる
n
などはlayerを表す添字で,下付きのtau
はsegmentを表す添字\circ
はconcatenationを表すL_max * d
のpositional encoding U
を用いると,異なるsegment間の同じ位置の判別が出来ない(segment tau
の位置i
の単語と,segment tau + 1
の位置i
について,同じpositional encodingとなってしまう)
ざっくり言うと
キーワード
1. 情報
論文リンク
https://arxiv.org/abs/1901.02860
著者
Zihang Dai, Zhilin Yang, Yiming Yang, Jaime Carbonell, Quoc V. Le, Ruslan Salakhutdinov
投稿日付
2019/1/9 (ACL 2019)
2. 先行研究と比べてどこがすごい?
3. 技術や手法のキモはどこ?
4. どうやって有効だと検証した?
5. 議論はある?
6. 次に読むべき論文は?