Closed AtsukiOsanai closed 1 year ago
Two-stage(detect & recognize)のText Spotterではdetectionの精度がrecognitionのlimitationとなるため、本論文ではOne-StageのText Spotterを提案する。提案手法はInstance Mask Attention(IMA), Character Mask Attention(CMA)モジュールを有することで、画像からCharacter-levelのfeature sequenceを得ることができる。これをRecognizerの基本パターン(RNN + Linear)に通して文字系列をE2Eに推定可能。また、Centerline segmentationをsub taskとして解いておき、テキストインスタンスの区別のために利用する。
MANGO: A Mask Attention Guided One-Stage Scene Text Spotter
Information
Summary
サマリ図表
どんな論文か?
Two-stage(detect & recognize)のText Spotterではdetectionの精度がrecognitionのlimitationとなるため、本論文ではOne-StageのText Spotterを提案する。提案手法はInstance Mask Attention(IMA), Character Mask Attention(CMA)モジュールを有することで、画像からCharacter-levelのfeature sequenceを得ることができる。これをRecognizerの基本パターン(RNN + Linear)に通して文字系列をE2Eに推定可能。また、Centerline segmentationをsub taskとして解いておき、テキストインスタンスの区別のために利用する。
新規性
結果
その他(なぜ通ったか?など)