HyperAIHyperAI

Command Palette

Search for a command to run...

多方向シーンテキスト検出のための統合テキストセグメンテーションネットワーク

概要

本稿では、インスタンス認識を意識したセマンティックセグメンテーションの観点から、多方向のシーンテキスト検出を対象とした新たなエンドツーエンドフレームワークを提案する。我々は、テキストインスタンスは一般の物体よりも細粒度な特徴表現に依存する可能性があることから、特徴抽出段階で複数レベルの特徴を統合する「Fused Text Segmentation Networks(融合テキストセグメンテーションネットワーク)」を提案する。この手法は、セマンティックセグメンテーションと領域提案ベースの物体検出の両タスクの利点を活かしつつ、テキストインスタンスの検出とセグメンテーションを同時に統合的に実行する。追加のパイプラインを導入することなく、ICDAR2015 Incidental Scene TextおよびMSRA-TD500という複数方向シーンテキスト検出ベンチマークにおいて、それぞれHmean 84.1%および82.0%という性能を達成し、現行の最先端手法を上回った。さらに、曲線テキストを含むTotal-Textデータセット上におけるベースライン結果も報告し、提案手法の有効性を示唆している。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています