Open supikiti opened 4 years ago
https://ieeexplore.ieee.org/document/9054148
TransformerにLocal-RNNを導入することにより短期的構造と長期的構造を効率よくモデリング可能なTransformerを提案 (LR-Transformer)
Position Embeddingsを使用せず短期的な構造をモデリング可能
Sequence全体をRNNでモデリングするのではなく,Sequenceを区切ったものをそれぞれ重みを共有したRNNへ 入力することで計算コストを抑え,局所構造をモデリング可能
リンク
https://ieeexplore.ieee.org/document/9054148
どんなもの?
TransformerにLocal-RNNを導入することにより短期的構造と長期的構造を効率よくモデリング可能なTransformerを提案 (LR-Transformer)
先行研究と比べてどこがすごい?
Position Embeddingsを使用せず短期的な構造をモデリング可能
技術と手法のキモはどこ?
Sequence全体をRNNでモデリングするのではなく,Sequenceを区切ったものをそれぞれ重みを共有したRNNへ 入力することで計算コストを抑え,局所構造をモデリング可能
どうやって有効だと検証した?
議論はある?
次に読むべき論文