2ヶ月前
アンカー最適化を用いたガイデッドテーブル構造認識
Khurram Azeem Hashmi; Didier Stricker; Marcus Liwicki; Muhammad Noman Afzal; Muhammad Zeshan Afzal

要約
本論文では、ガイデッドアンカーを活用したテーブル構造認識の新規アプローチを提案します。この概念は、単純に物体検出手法を適用する現在の最先端のテーブル構造認識手法とは異なります。従来の手法と対照的に、まずテーブル構造認識に適したアンカーを推定します。その後、これらのアンカーを利用して表画像内の行と列の位置を特定します。さらに、本論文では現実的なシナリオにおいて表レイアウトを使用することで結果を改善する単純かつ効果的な方法を紹介します。提案手法は、公開されている2つのテーブル構造認識データセットであるICDAR-2013とTabStructDBで徹底的に評価されました。ICDAR-2013データセットでは平均F値95.05%(行で94.6%、列で96.32%)という最先端の結果を達成し、TabStructDBデータセットでは平均F値94.17%(行で94.08%、列で95.06%)でベースライン結果を超えることができました。