2ヶ月前

多方向場面文字検出のための融合テキストセグメンテーションネットワーク

Dai, Yuchen ; Huang, Zheng ; Gao, Yuting ; Xu, Youxuan ; Chen, Kai ; Guo, Jie ; Qiu, Weidong
多方向場面文字検出のための融合テキストセグメンテーションネットワーク
要約

本論文では、インスタンス認識に基づく意味セグメンテーションの観点から多方向シーンテキスト検出のための新しいエンドツーエンドフレームワークを提案します。Fused Text Segmentation Networks(FTSN)を紹介し、これは特徴抽出時に複数レベルの特徴を組み合わせることで、一般的な物体よりも細かい特徴表現が必要となるテキストインスタンスに対応します。このネットワークは、意味セグメンテーションタスクと領域提案ベースの物体検出タスク双方の利点を活用して、テキストインスタンスの検出とセグメンテーションを同時に行います。追加のパイプラインを必要とせず、当該手法はICDAR2015 Incidental Scene TextおよびMSRA-TD500という多方向シーンテキスト検出ベンチマークにおいてHmeanがそれぞれ84.1%と82.0%に達し、現行の最先端技術を上回っています。さらに、曲線テキストを含むTotal-Textデータセットでの基準結果も報告しており、提案手法の有効性が示されています。

多方向場面文字検出のための融合テキストセグメンテーションネットワーク | 最新論文 | HyperAI超神経