要約
ドキュメント処理システムにおいて、スキャンされたドキュメント画像に関して、歪み推定(skew estimation)は重要なタスクの一つである。これは、その後の処理ステップに直接影響を与えるため、その性能が極めて重要となるからである。デジタル化の進展に伴い、この課題に取り組む研究は数多く行われてきた。本研究では、まず、2次元離散フーリエ変換のマグニチュードスペクトルに対して適応型ラジアルプロジェクション(Adaptive Radial Projection)を適用し、入力ドキュメント画像の主要な歪み角度を抽出する新たな歪み推定手法を提案する。次に、異なる推定手法の性能を評価するための高品質な歪み推定データセット「DISE-2021」を公開する。さらに、フーリエベースの手法に関する複数の改善点について包括的な分析を行う。実験結果から、提案手法が優れたロバスト性と信頼性を有し、比較対象のすべての手法を上回ることが明らかになった。本研究で用いたデータおよびコードは、https://github.com/phamquiluan/jdeskew にて公開されている。