Command Palette
Search for a command to run...
多方向シーンテキスト検出のための統合テキストセグメンテーションネットワーク
多方向シーンテキスト検出のための統合テキストセグメンテーションネットワーク
概要
本稿では、インスタンス認識を意識したセマンティックセグメンテーションの観点から、多方向のシーンテキスト検出を対象とした新たなエンドツーエンドフレームワークを提案する。我々は、テキストインスタンスは一般の物体よりも細粒度な特徴表現に依存する可能性があることから、特徴抽出段階で複数レベルの特徴を統合する「Fused Text Segmentation Networks(融合テキストセグメンテーションネットワーク)」を提案する。この手法は、セマンティックセグメンテーションと領域提案ベースの物体検出の両タスクの利点を活かしつつ、テキストインスタンスの検出とセグメンテーションを同時に統合的に実行する。追加のパイプラインを導入することなく、ICDAR2015 Incidental Scene TextおよびMSRA-TD500という複数方向シーンテキスト検出ベンチマークにおいて、それぞれHmean 84.1%および82.0%という性能を達成し、現行の最先端手法を上回った。さらに、曲線テキストを含むTotal-Textデータセット上におけるベースライン結果も報告し、提案手法の有効性を示唆している。