7ヶ月前

オブジェクト検出

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Pengfei Wang Zuming Huang Jingtuo Liu Chengquan Zhang Mengyi En Errui Ding Fei Qi Junyu Han Guangming Shi

概要

過去数年間、任意の形状を持つシーンテキストの検出は難題でした。本論文では、Fully Convolutional Network（FCN）を基盤とするコンテクスト注意多タスク学習フレームワークを用いて、テキスト領域の多角形表現の再構成に必要な様々な幾何学的特性を学習する新しいセグメンテーションベースのテキスト検出器SASTを提案します。テキストの連続的な特性を考慮し、長距離依存関係のピクセル情報を捕捉してより信頼性のあるセグメンテーションを得るため、コンテクスト注意ブロックが導入されました。後処理においては、高レベルなオブジェクト知識と低レベルなピクセル情報の両方を統合して一発でピクセルをテキストインスタンスにクラスタリングするPoint-to-Quad割り当て手法が提案されています。さらに、提案された幾何学的特性により、任意形状のテキストの多角形表現が効果的に抽出できます。ICDAR2015、ICDAR2017-MLT、SCUT-CTW1500、Total-Textなどのベンチマークでの実験結果から、SASTは精度に関して優れたまたは同等の性能を達成することが示されています。また、単一のNVIDIA Titan Xpグラフィックスカードを使用してSCUT-CTW1500上でHmean 81.0%で27.63 FPSで動作することから、既存の大半のセグメンテーションベース手法を超えることが確認されています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

オブジェクト検出

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Pengfei Wang Zuming Huang Jingtuo Liu Chengquan Zhang Mengyi En Errui Ding Fei Qi Junyu Han Guangming Shi

概要

過去数年間、任意の形状を持つシーンテキストの検出は難題でした。本論文では、Fully Convolutional Network（FCN）を基盤とするコンテクスト注意多タスク学習フレームワークを用いて、テキスト領域の多角形表現の再構成に必要な様々な幾何学的特性を学習する新しいセグメンテーションベースのテキスト検出器SASTを提案します。テキストの連続的な特性を考慮し、長距離依存関係のピクセル情報を捕捉してより信頼性のあるセグメンテーションを得るため、コンテクスト注意ブロックが導入されました。後処理においては、高レベルなオブジェクト知識と低レベルなピクセル情報の両方を統合して一発でピクセルをテキストインスタンスにクラスタリングするPoint-to-Quad割り当て手法が提案されています。さらに、提案された幾何学的特性により、任意形状のテキストの多角形表現が効果的に抽出できます。ICDAR2015、ICDAR2017-MLT、SCUT-CTW1500、Total-Textなどのベンチマークでの実験結果から、SASTは精度に関して優れたまたは同等の性能を達成することが示されています。また、単一のNVIDIA Titan Xpグラフィックスカードを使用してSCUT-CTW1500上でHmean 81.0%で27.63 FPSで動作することから、既存の大半のセグメンテーションベース手法を超えることが確認されています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています