16日前

DocUNet:スタックドU-Netを用いたドキュメント画像のアンワーピング

{Jue Wang, Xue Bai, Zhixin Shu, Ke Ma, Dimitris Samaras}
DocUNet:スタックドU-Netを用いたドキュメント画像のアンワーピング
要約

文書画像の取得は、モバイルカメラの普及により、物理文書をデジタル化および記録するための一般的な手法である。テキスト認識を容易にするために、実際の文書が折れたり湾曲したりしている場合、その画像をデジタル的に平坦化することが望ましい。本論文では、この目的を達成する初めての学習ベースの手法を提案する。我々は、歪んだ画像から補正された画像への前向きマッピングを直接予測するため、中間監視を導入したスタック型U-Netを提案する。大規模な実世界データセットにおいて真の変形情報を得ることは困難であるため、歪みのない文書画像を変形することで、約10万枚の合成画像からなるデータセットを構築した。このデータセットを用いて、多様なデータ拡張を施した上でネットワークを学習させ、一般化能力の向上を図った。さらに、実世界のさまざまな状況を網羅する包括的なベンチマークを構築した。提案モデルは、このベンチマーク上で定量的および定性的に評価され、従来の非学習ベースの手法と比較されている。

DocUNet:スタックドU-Netを用いたドキュメント画像のアンワーピング | 最新論文 | HyperAI超神経