2ヶ月前

U-DIADS-Bib: 古文書のレイアウト分析用フルおよびFew-Shotピクセル精度データセット

Zottin, Silvia ; De Nardin, Axel ; Colombi, Emanuela ; Piciarelli, Claudio ; Pavan, Filippo ; Foresti, Gian Luca
U-DIADS-Bib: 古文書のレイアウト分析用フルおよびFew-Shotピクセル精度データセット
要約

ドキュメントレイアウト分析は、文書ページ内の異なる意味領域を識別するタスクであり、コンピュータ科学者と人文学者の両方にとって大きな関心事となっています。前者にとってはさらなる分析タスクへの基本的なステップであり、後者にとっては文書の研究を改善し、容易にする強力なツールとなるからです。しかし、現在の文献に見られる多くの研究、特に利用可能なデータセットにおいては、両者のニーズを満たすことができず、特にコンピュータサイエンス側のニーズや一般的な慣行に傾倒しがちで、人文科学の実際のニーズを代表していないリソースが生まれています。この理由から、本論文ではU-DIADS-Bibという新しいデータセットを紹介します。これは、コンピュータビジョンと人文科学分野の専門家との密接な協力のもとに開発された、ピクセル精度で非重複かつノイズのないドキュメントレイアウト分析データセットです。さらに、手動アノテーションという時間のかかるプロセスの負担を軽減するために、新たなコンピューター支援セグメンテーションパイプラインを提案します。手動アノテーションは真実値セグメンテーションマップ生成のために必要不可欠なプロセスです。最後に、サンプル数が極めて少ない状況でもこのタスクに対応できるモデルや解決策の開発を促進することを目指して、標準化された少ショット版データセット(U-DIADS-BibFS)を提示します。これにより、大量のセグメンテーションを集めることが常に現実的ではない実世界シナリオでのより効果的な利用が可能となります。

U-DIADS-Bib: 古文書のレイアウト分析用フルおよびFew-Shotピクセル精度データセット | 最新論文 | HyperAI超神経