17日前
ドキュメント画像の歪み補正のためのゲート付きかつ分岐型スタックU-Netモジュール
Hmrishav Bandyopadhyay, Tanmoy Dasgupta, Nibaran Das, Mita Nasipuri

要約
書類の画像を撮影することは、記録するための最も簡単で広く用いられている手法の一つである。しかし、携帯端末を用いて撮影された画像は、しばしば補正が困難な歪みを含み、望ましくない影響を及ぼすことがある。本研究では、入力画像から歪みのない画像を生成するための、教師ありのゲート付きかつ分岐型のスタック型U-Netモジュールを提案する。このネットワークは合成的に歪められた書類画像で学習されるが、評価は実世界の画像に基づいて行われる。本手法の新規性は、U-Netの分岐構造によりグリッド座標の混在を効果的に回避する点に加え、ゲート構造を用いることで境界線や微細な線分レベルの詳細情報をモデルに追加する点にある。提案するエンドツーエンドのパイプラインは、従来手法で用いられたデータのわずか8%のみで学習されたにもかかわらず、DocUNetデータセットにおいて最先端の性能を達成した。