Command Palette

Search for a command to run...

4ヶ月前

ICDAR 2024 古文書の少サンプルおよび多数サンプルレイアウトセグメンテーション競技(SAM)

{Claudio Piciarelli Emanuela Colombi Gian Luca Foresti Axel De Nardin Silvia Zottin}

要約

レイアウト解析は、特に古代写本において文書画像解析における重要な側面である。これは、光学文字認識や自動転記といった後続タスクを効率化するための基盤となるステップである。しかしながら、この分野における主な課題の一つは、正確なラベル(グランド・トゥルース)が極めて限られていることにある。これは、これらのラベルを生成する作業が非常に時間と労力を要するためである。それでも、多数のアプローチは完全に教師あり学習(fully supervised learning)に依拠しており、これは現実の現場では稀な状況である。このような背景から、本コンペティションでは、わずか3枚の画像のみを用いた少データ学習(few-shot learning)アプローチによるこのタスクの解決を挑戦課題として提示する。本コンペティションのデータセット「U-DIADS-Bib」は、4種類の異なる古代写本から構成されており、レイアウト構造の多様性、劣化度の違い、使用言語の多様性といった特徴を備えている。この多様性が、課題の興味深さと複雑さを一層高めている。さらに、従来の多数データ学習(many-shot learning)アプローチを用いた参加も許容されており、U-DIADS-Bibの全訓練データセットが提供されている。

ベンチマーク

ベンチマーク方法論指標
document-layout-analysis-on-u-diads-bibL3i++
Class Average IoU (Few-shot setting): 61.10
document-layout-analysis-on-u-diads-bibCNKI
Class Average IoU: 77.80
Class Average IoU (Few-shot setting): 65.90
document-layout-analysis-on-u-diads-bibVAI-OCR
Class Average IoU: 70.70
Class Average IoU (Few-shot setting): 70.00
document-layout-analysis-on-u-diads-bibCV-Group
Class Average IoU: 83.40
Class Average IoU (Few-shot setting): 78.40

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
ICDAR 2024 古文書の少サンプルおよび多数サンプルレイアウトセグメンテーション競技(SAM) | 論文 | HyperAI超神経