HyperAIHyperAI

Command Palette

Search for a command to run...

ピクセル単位の手書き文書レイアウト解析における効率的なFew-shot学習

Axel De Nardin Silvia Zottin Matteo Paier Gian Luca Foresti Emanuela Colombi Claudio Piciarelli

概要

レイアウト解析は、古代手書き文書解析において極めて重要なタスクであり、光学文字認識や自動転写といった後続タスクの簡素化に向けた基盤的なステップを担っている。しかし、この問題を解決するために採用される多くの手法は、完全な教師あり学習(fully supervised learning)の枠組みに依存している。こうしたシステムは、このタスクにおいて非常に優れた性能を発揮する一方で、トレーニングデータセット全体に対してピクセル単位の正確なテキストラベル付けが必要となるという欠点がある。このラベル付け作業は非常に時間がかかり、実際の現場ではこうした情報が極めて稀にしか入手できない状況となっている。本論文では、公開されているDIVA-HisDBデータセットにおいて、現在の最先端の教師あり学習手法と同等の性能を達成する効率的な少サンプル学習(few-shot learning)フレームワークを提案することで、この課題に取り組む。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています