7ヶ月前

ドキュメント理解

コンピュータビジョン

データセット

AIインフラストラクチャ

自然言語処理

コンピュータビジョン

Claudio Piciarelli Emanuela Colombi Gian Luca Foresti Axel De Nardin Silvia Zottin

概要

レイアウト解析は、特に古代写本において文書画像解析における重要な側面である。これは、光学文字認識や自動転記といった後続タスクを効率化するための基盤となるステップである。しかしながら、この分野における主な課題の一つは、正確なラベル（グランド・トゥルース）が極めて限られていることにある。これは、これらのラベルを生成する作業が非常に時間と労力を要するためである。それでも、多数のアプローチは完全に教師あり学習（fully supervised learning）に依拠しており、これは現実の現場では稀な状況である。このような背景から、本コンペティションでは、わずか3枚の画像のみを用いた少データ学習（few-shot learning）アプローチによるこのタスクの解決を挑戦課題として提示する。本コンペティションのデータセット「U-DIADS-Bib」は、4種類の異なる古代写本から構成されており、レイアウト構造の多様性、劣化度の違い、使用言語の多様性といった特徴を備えている。この多様性が、課題の興味深さと複雑さを一層高めている。さらに、従来の多数データ学習（many-shot learning）アプローチを用いた参加も許容されており、U-DIADS-Bibの全訓練データセットが提供されている。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

ドキュメント理解

コンピュータビジョン

データセット

AIインフラストラクチャ

自然言語処理

コンピュータビジョン

Claudio Piciarelli Emanuela Colombi Gian Luca Foresti Axel De Nardin Silvia Zottin

概要

レイアウト解析は、特に古代写本において文書画像解析における重要な側面である。これは、光学文字認識や自動転記といった後続タスクを効率化するための基盤となるステップである。しかしながら、この分野における主な課題の一つは、正確なラベル（グランド・トゥルース）が極めて限られていることにある。これは、これらのラベルを生成する作業が非常に時間と労力を要するためである。それでも、多数のアプローチは完全に教師あり学習（fully supervised learning）に依拠しており、これは現実の現場では稀な状況である。このような背景から、本コンペティションでは、わずか3枚の画像のみを用いた少データ学習（few-shot learning）アプローチによるこのタスクの解決を挑戦課題として提示する。本コンペティションのデータセット「U-DIADS-Bib」は、4種類の異なる古代写本から構成されており、レイアウト構造の多様性、劣化度の違い、使用言語の多様性といった特徴を備えている。この多様性が、課題の興味深さと複雑さを一層高めている。さらに、従来の多数データ学習（many-shot learning）アプローチを用いた参加も許容されており、U-DIADS-Bibの全訓練データセットが提供されている。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています