Open tkuri opened 4 years ago
OCRの高精度化に伴い、スマホのアプリとカメラで気軽に文書をスキャンできるようになってきたが、依然折り畳まれていたりクシャクシャな文書を正しく認識するのは難しい。そこで文書の向きや単語の位置、文書自体の形状を認識してRectificationする学習ベースの手法を提案。
https://arxiv.org/abs/2008.02231
論文概要
OCRの高精度化に伴い、スマホのアプリとカメラで気軽に文書をスキャンできるようになってきたが、依然折り畳まれていたりクシャクシャな文書を正しく認識するのは難しい。そこで文書の向きや単語の位置、文書自体の形状を認識してRectificationする学習ベースの手法を提案。
https://arxiv.org/abs/2008.02231