HyperAIHyperAI

Command Palette

Search for a command to run...

PixelLink: シーンテキストの検出をインスタンスセグメンテーションを通じて行う

Jiaqi Chen Yuhang Guan Yonghong Tu

概要

最新のシーンテキスト検出アルゴリズムの多くは、バウンディングボックス回帰に依存する深層学習ベースの手法であり、少なくとも2種類の予測を行う:テキスト/非テキスト分類と位置回帰です。これらの手法において、回帰はバウンディングボックスの取得に重要な役割を果たしますが、必須ではありません。なぜなら、テキスト/非テキスト予測は自体に完全な位置情報が含まれるセマンティックセグメンテーションの一形態とみなすことができるからです。しかし、シーン画像中のテキストインスタンスはしばしば非常に近接しており、セマンティックセグメンテーションによってそれらを分離することが非常に困難であるため、インスタンスセグメンテーションが必要となります。本論文では、インスタンスセグメンテーションに基づく新しいシーンテキスト検出アルゴリズムであるPixelLink(ピクセルリンク)を提案します。まず、同じインスタンス内のピクセルを連結することでテキストインスタンスをセグメント化し、次に位置回帰なしでセグメンテーション結果から直接テキストのバウンディングボックスを抽出します。実験結果によると、回帰に基づく手法と比較してPixelLinkはいくつかのベンチマークで同等または優れた性能を達成しながら、多くの訓練イタレーションと少ない訓練データを必要とするという特徴があります。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
PixelLink: シーンテキストの検出をインスタンスセグメンテーションを通じて行う | 記事 | HyperAI超神経