AtsukiOsanai / cv_survey

Personal repository for computer vision survey
2 stars 0 forks source link

NON-AUTOREGRESSIVE ASR WITH SELF-CONDITIONED FOLDED ENCODERS #84

Closed AtsukiOsanai closed 2 years ago

AtsukiOsanai commented 2 years ago

NON-AUTOREGRESSIVE ASR WITH SELF-CONDITIONED FOLDED ENCODERS

Information

Summary

サマリ図表

スクリーンショット 2022-11-30 17 52 37

どんな論文か?

Automatic Speech Recognition(ASR)における高効率なCTC-basedモデルの提案。Attention with Auto-Regressiveを採用しないのはlatencyが遅いため。CTC-basedで高い精度をマークしているintermediate-CTC, self-conditioned-CTCをベースに、1つのDecoderをIterativeに利用するアーキテクチャとすることで少ないパラメータでも高い精度をマークした。

新規性

Shared Decoderを採用した効率的なネットワーク構造を提案

結果

その他(なぜ通ったか?など)

ベースとなる技術についてのメモ。