AtsukiOsanai / cv_survey

Personal repository for computer vision survey
2 stars 0 forks source link

Towards Weakly-Supervised Text Spotting using a Multi-Task Transformer #37

Closed AtsukiOsanai closed 2 years ago

AtsukiOsanai commented 2 years ago

Towards Weakly-Supervised Text Spotting using a Multi-Task Transformer

Information

Summary

サマリ図表

スクリーンショット 2023-01-10 14 07 42 スクリーンショット 2022-06-20 22 55 47

どんな論文か?

画像に含まれるテキストラベルのみから、テキストの検出・領域分割・認識の3タスクを弱教師あり学習(WSL)でE2Eに解く。学習は2段階になっており、①(3タスクの教師データが付与された)SynthTextデータセットで教師あり学習(SL)、②SynthTextとテキストラベルのみが付与されたRealデータのMixでWSL、を行う。

新規性

結果

ICDAR15/Total-TextにおいてSOTAsにComparableな精度を達成

その他(なぜ通ったか?など)

AtsukiOsanai commented 2 years ago

cvpaper.challenge投稿済み