Command Palette
Search for a command to run...
Total-Text:シーンテキスト検出および認識のための包括的データセット
Total-Text:シーンテキスト検出および認識のための包括的データセット
Chng Chee Kheng Chan Chee Seng
概要
カーブ方向テキストは、現実世界の環境において一般的なテキスト方向の一つであるにもかかわらず、ICDAR2013やMSRA-TD500といった広く評価されているシーンテキストデータセットでは、ほぼ存在しない状態にあった。Total-Textの主な目的は、こうしたギャップを埋め、シーンテキスト研究コミュニティに新たな研究方向性を提供することにある。従来の水平方向および多方向テキストに加え、Total-Textはカーブ方向テキストを特徴としている。Total-Textは方向性の多様性が極めて高く、全体の半数以上が2つ以上の方向が組み合わさった画像を含んでいる。近年、テキスト検出をセグメンテーション問題として定式化する新しいアプローチが、多方向テキストに対して有効性を示している。本研究では、こうしたカーブ方向テキストに対するロバスト性を評価するため、DeconvNetを微調整し、Total-Text上でベンチマークを行った。Total-Textのアノテーション付きデータは、https://github.com/cs-chan/Total-Text-Dataset にて公開されている。