6 个月前

计算机视觉

计算机视觉

Masato Fujitake

摘要

场景文本定位（Scene-text spotting）是一项同时预测自然场景图像中文本区域并识别其字符的任务，近年来因其广泛的应用前景而受到广泛关注。现有研究主要聚焦于提升文本区域检测的性能，而对文本识别的关注相对不足。因此，尽管检测精度有所提高，端到端的整体识别准确率仍不理想。自然场景图像中的文本通常并非随机字符组合，而是具有语义意义的词组。为此，本文提出一种面向场景文本定位的语义表示对抗学习方法（Adversarial Learning of Semantic Representations for Scene Text Spotting, A3S），旨在提升端到端的识别准确率，包括文本识别能力。A3S在检测到的文本区域内同时预测语义特征，而非仅依赖现有的视觉特征进行文本识别。在多个公开数据集上的实验结果表明，所提出的方法在准确率方面优于现有其他方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

计算机视觉

计算机视觉

Masato Fujitake

摘要

场景文本定位（Scene-text spotting）是一项同时预测自然场景图像中文本区域并识别其字符的任务，近年来因其广泛的应用前景而受到广泛关注。现有研究主要聚焦于提升文本区域检测的性能，而对文本识别的关注相对不足。因此，尽管检测精度有所提高，端到端的整体识别准确率仍不理想。自然场景图像中的文本通常并非随机字符组合，而是具有语义意义的词组。为此，本文提出一种面向场景文本定位的语义表示对抗学习方法（Adversarial Learning of Semantic Representations for Scene Text Spotting, A3S），旨在提升端到端的识别准确率，包括文本识别能力。A3S在检测到的文本区域内同时预测语义特征，而非仅依赖现有的视觉特征进行文本识别。在多个公开数据集上的实验结果表明，所提出的方法在准确率方面优于现有其他方法。

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供