Closed AtsukiOsanai closed 2 years ago
画像に含まれるテキストラベルのみから、テキストの検出・領域分割・認識の3タスクを弱教師あり学習(WSL)でE2Eに解く。学習は2段階になっており、①(3タスクの教師データが付与された)SynthTextデータセットで教師あり学習(SL)、②SynthTextとテキストラベルのみが付与されたRealデータのMixでWSL、を行う。
ICDAR15/Total-TextにおいてSOTAsにComparableな精度を達成
cvpaper.challenge投稿済み
Towards Weakly-Supervised Text Spotting using a Multi-Task Transformer
Information
Summary
サマリ図表
どんな論文か?
画像に含まれるテキストラベルのみから、テキストの検出・領域分割・認識の3タスクを弱教師あり学習(WSL)でE2Eに解く。学習は2段階になっており、①(3タスクの教師データが付与された)SynthTextデータセットで教師あり学習(SL)、②SynthTextとテキストラベルのみが付与されたRealデータのMixでWSL、を行う。
新規性
結果
ICDAR15/Total-TextにおいてSOTAsにComparableな精度を達成
その他(なぜ通ったか?など)