Open IsHYuhi opened 3 years ago
Seungjun Jung1, Muhammad Abul Hasan2, and Changick Kim1
1KAIST, Daejeon, Republic of Korea 2University of South Australia, Adelaide, SA, Australia
ACCV 2018
arXiv 実装
本研究では, デジタル化された文書の影アーティファクトを除去することで, 証明を補正する新しいアルゴリズムを提案. 各画素の輝度値を用いて, 入力された文書のtopographicなsurfaceを作成する. 次にimmersion processをシミュレーションすることで, 文書上の影を推定. immersion processのシミュレーションはiterative updateルールを持つ拡散方程式を用いてモデル化される. 影を推定した後, Lambertian surfaceモデルを用いて文書を再構築する. 提案した手法は木々恣意照明条件の下で撮像された文書のセットに対して, 有効な照明補正効果をもたらし, SoTAを上回った.
従来手法では, 背景の影を推定することから始まり, 次に文書表面再構成モデルを使用して影を除去する.これらの戦略は、mask-and-interpolationアプローチとwithout-mask-interpolationアプローチの2つの主要なカテゴリーに分けることができる. 前者のアプローチでは, エッジ検出や二値化法を用いて, 文書上のテキストや写真の領域の位置を把握し, 次に文書の表面上のテキスト領域とその隣接領域を覆うマスクを適用する.最後に, マスクされた領域を補間して, デジタル化されたドキュメントの背景の照明を補正する. 後者の手法では, 文書画像パッチのカラーヒストグラムを用いて, 背景に属する局所領域を集約し, 残りの領域を補間して影領域をする. よく知られている表面モデルを用いて影を除去することは簡単な作業であるため, 文献に記載されているほとんどの研究は, 背景をできるだけ正確に抽出することだけに集中していた.
本論文では, デジタル化された画像ピクセルの輝度値を用いて, 地形面を構築する. 次に, 拡散方程式を用いて流体の力学を表現したモデルを地形面に適用し, 文書の影を推定する. そして, 影を推定した後, lambertian表面モデルを用いてデジタル化された文書を再構成し, 影を除去することで照明を補正する. 提案されたアルゴリズムを設計するにあたり, 流域変換に適用されている技術に影響を受けている.
提案手法の限界は, 画像の境界に接続されたテキストや写真が影とみなされ, 処理後に除去されてしまうことである. しかし, 文書画像の中で重要なテキストや写真は通常, 画像の境界に接続されていないため, これは重大な問題ではないことがわかった. また, 鏡面反射を除去する際には, 背景層を正確に推定しても, 前景層にある点の元の輝度値が露出過多で大きく損なわれると. ランベルト表面モデルを用いてその点を再構成することが困難になるため, 満足のいく結果が得られないことが多いことも指摘しておきたい.
INFO
author
Seungjun Jung1, Muhammad Abul Hasan2, and Changick Kim1
affiliation
1KAIST, Daejeon, Republic of Korea 2University of South Australia, Adelaide, SA, Australia
conference or year
ACCV 2018
link
arXiv 実装
概要
本研究では, デジタル化された文書の影アーティファクトを除去することで, 証明を補正する新しいアルゴリズムを提案. 各画素の輝度値を用いて, 入力された文書のtopographicなsurfaceを作成する. 次にimmersion processをシミュレーションすることで, 文書上の影を推定. immersion processのシミュレーションはiterative updateルールを持つ拡散方程式を用いてモデル化される. 影を推定した後, Lambertian surfaceモデルを用いて文書を再構築する. 提案した手法は木々恣意照明条件の下で撮像された文書のセットに対して, 有効な照明補正効果をもたらし, SoTAを上回った.
従来手法では, 背景の影を推定することから始まり, 次に文書表面再構成モデルを使用して影を除去する.これらの戦略は、mask-and-interpolationアプローチとwithout-mask-interpolationアプローチの2つの主要なカテゴリーに分けることができる. 前者のアプローチでは, エッジ検出や二値化法を用いて, 文書上のテキストや写真の領域の位置を把握し, 次に文書の表面上のテキスト領域とその隣接領域を覆うマスクを適用する.最後に, マスクされた領域を補間して, デジタル化されたドキュメントの背景の照明を補正する. 後者の手法では, 文書画像パッチのカラーヒストグラムを用いて, 背景に属する局所領域を集約し, 残りの領域を補間して影領域をする. よく知られている表面モデルを用いて影を除去することは簡単な作業であるため, 文献に記載されているほとんどの研究は, 背景をできるだけ正確に抽出することだけに集中していた.
本論文では, デジタル化された画像ピクセルの輝度値を用いて, 地形面を構築する. 次に, 拡散方程式を用いて流体の力学を表現したモデルを地形面に適用し, 文書の影を推定する. そして, 影を推定した後, lambertian表面モデルを用いてデジタル化された文書を再構成し, 影を除去することで照明を補正する. 提案されたアルゴリズムを設計するにあたり, 流域変換に適用されている技術に影響を受けている.
提案手法
検証
新規性
議論,展望
提案手法の限界は, 画像の境界に接続されたテキストや写真が影とみなされ, 処理後に除去されてしまうことである. しかし, 文書画像の中で重要なテキストや写真は通常, 画像の境界に接続されていないため, これは重大な問題ではないことがわかった. また, 鏡面反射を除去する際には, 背景層を正確に推定しても, 前景層にある点の元の輝度値が露出過多で大きく損なわれると. ランベルト表面モデルを用いてその点を再構成することが困難になるため, 満足のいく結果が得られないことが多いことも指摘しておきたい.
Comment
date