12日前

ICDAR 2024 古文書の少サンプルおよび多数サンプルレイアウトセグメンテーション競技(SAM)

{Claudio Piciarelli, Emanuela Colombi, Gian Luca Foresti, Axel De Nardin, Silvia Zottin}
要約

レイアウト解析は、特に古代写本において文書画像解析における重要な側面である。これは、光学文字認識や自動転記といった後続タスクを効率化するための基盤となるステップである。しかしながら、この分野における主な課題の一つは、正確なラベル(グランド・トゥルース)が極めて限られていることにある。これは、これらのラベルを生成する作業が非常に時間と労力を要するためである。それでも、多数のアプローチは完全に教師あり学習(fully supervised learning)に依拠しており、これは現実の現場では稀な状況である。このような背景から、本コンペティションでは、わずか3枚の画像のみを用いた少データ学習(few-shot learning)アプローチによるこのタスクの解決を挑戦課題として提示する。本コンペティションのデータセット「U-DIADS-Bib」は、4種類の異なる古代写本から構成されており、レイアウト構造の多様性、劣化度の違い、使用言語の多様性といった特徴を備えている。この多様性が、課題の興味深さと複雑さを一層高めている。さらに、従来の多数データ学習(many-shot learning)アプローチを用いた参加も許容されており、U-DIADS-Bibの全訓練データセットが提供されている。