Closed AtsukiOsanai closed 2 years ago
Automatic Speech Recognition(ASR)における高効率なCTC-basedモデルの提案。Attention with Auto-Regressiveを採用しないのはlatencyが遅いため。CTC-basedで高い精度をマークしているintermediate-CTC, self-conditioned-CTCをベースに、1つのDecoderをIterativeに利用するアーキテクチャとすることで少ないパラメータでも高い精度をマークした。
Shared Decoderを採用した効率的なネットワーク構造を提案
ベースとなる技術についてのメモ。
NON-AUTOREGRESSIVE ASR WITH SELF-CONDITIONED FOLDED ENCODERS
Information
Summary
サマリ図表
どんな論文か?
Automatic Speech Recognition(ASR)における高効率なCTC-basedモデルの提案。Attention with Auto-Regressiveを採用しないのはlatencyが遅いため。CTC-basedで高い精度をマークしているintermediate-CTC, self-conditioned-CTCをベースに、1つのDecoderをIterativeに利用するアーキテクチャとすることで少ないパラメータでも高い精度をマークした。
新規性
Shared Decoderを採用した効率的なネットワーク構造を提案
結果
その他(なぜ通ったか?など)
ベースとなる技術についてのメモ。