Open osuossu8 opened 2 years ago
深層学習と、構造化されていないテキスト ドキュメントからアドレスを見つけて抽出するための推論を組み合わせたハイブリッド アプローチを提案
ビジュアル ディープ ラーニング モデルを使用して、スキャンされたドキュメント画像の可能な住所領域の境界を検出し、ルールベースのシステムとして表されるドメイン知識を使用して含まれるテキストを分析することにより、これらの結果を検証
アドレス データを抽出し、ドキュメントの送信者または受信者をデータベースと照合することは、自動化されたドキュメント処理の最初のステップであることがよくある
finetune 利用には, 優れた基礎モデルが必要だが, (主に英語圏の) ビジネス通信データの場合は open public data が利用できるがドイツ語ビジネスデータセットはない
全体として、両方の純粋な方法を比較すると、さまざまなレイアウトに対するディープ ラーニングの一般化機能と、典型的な推論における誤検知の削減を組み合わせたハイブリッド アプローチが有望である
住所抽出の問題定義のハイブリッド手法 このユース ケースでは、住所検出の目標は次の 2 つの手順で達成されます。 (送信者、受信者、その他) 検出された送信者と受信者のアドレスは、ドキュメント ページごとに 1 つのインスタンスに制限されますが、他のアドレスの量は無制限のままです。 地域境界内のテキストに正しい住所の郵便番号と都市名が少なくとも含まれている場合、住所候補は正しく検出されたと見なされます。
https://arxiv.org/pdf/2202.03103.pdf @ 2022, AAAI