AtsukiOsanai / cv_survey

Personal repository for computer vision survey
2 stars 0 forks source link

MANGO: A Mask Attention Guided One-Stage Scene Text Spotter #98

Closed AtsukiOsanai closed 1 year ago

AtsukiOsanai commented 1 year ago

MANGO: A Mask Attention Guided One-Stage Scene Text Spotter

Information

Summary

サマリ図表

スクリーンショット 2023-01-10 6 37 20

どんな論文か?

Two-stage(detect & recognize)のText Spotterではdetectionの精度がrecognitionのlimitationとなるため、本論文ではOne-StageのText Spotterを提案する。提案手法はInstance Mask Attention(IMA), Character Mask Attention(CMA)モジュールを有することで、画像からCharacter-levelのfeature sequenceを得ることができる。これをRecognizerの基本パターン(RNN + Linear)に通して文字系列をE2Eに推定可能。また、Centerline segmentationをsub taskとして解いておき、テキストインスタンスの区別のために利用する。

新規性

結果

スクリーンショット 2023-01-10 6 34 50 スクリーンショット 2023-01-10 6 35 07

その他(なぜ通ったか?など)