17日前
ピクセル単位の手書き文書レイアウト解析における効率的なFew-shot学習
Axel De Nardin, Silvia Zottin, Matteo Paier, Gian Luca Foresti, Emanuela Colombi, Claudio Piciarelli

要約
レイアウト解析は、古代手書き文書解析において極めて重要なタスクであり、光学文字認識や自動転写といった後続タスクの簡素化に向けた基盤的なステップを担っている。しかし、この問題を解決するために採用される多くの手法は、完全な教師あり学習(fully supervised learning)の枠組みに依存している。こうしたシステムは、このタスクにおいて非常に優れた性能を発揮する一方で、トレーニングデータセット全体に対してピクセル単位の正確なテキストラベル付けが必要となるという欠点がある。このラベル付け作業は非常に時間がかかり、実際の現場ではこうした情報が極めて稀にしか入手できない状況となっている。本論文では、公開されているDIVA-HisDBデータセットにおいて、現在の最先端の教師あり学習手法と同等の性能を達成する効率的な少サンプル学習(few-shot learning)フレームワークを提案することで、この課題に取り組む。