2 个月前

EAST:一种高效且准确的场景文本检测器

Zhou, Xinyu ; Yao, Cong ; Wen, He ; Wang, Yuzhi ; Zhou, Shuchang ; He, Weiran ; Liang, Jiajun
EAST:一种高效且准确的场景文本检测器
摘要

先前的场景文本检测方法已经在各种基准测试中取得了令人鼓舞的性能。然而,即使配备了深度神经网络模型,它们在处理具有挑战性的场景时通常仍表现不佳,因为整体性能取决于管道中多个阶段和组件之间的相互作用。在这项工作中,我们提出了一种简单而强大的管道,能够在自然场景中实现快速且准确的文本检测。该管道直接预测图像中的任意方向和四边形形状的单词或文本行,消除了不必要的中间步骤(例如候选区域聚合和单词分割),仅通过一个神经网络即可完成。我们管道的简洁性使得可以集中精力设计损失函数和神经网络架构。在包括ICDAR 2015、COCO-Text和MSRA-TD500在内的标准数据集上的实验表明,所提出的算法在准确性和效率方面均显著优于现有最先进方法。在ICDAR 2015数据集上,所提出的算法以720p分辨率实现了13.2帧每秒的速度,F值达到0.7820。

EAST:一种高效且准确的场景文本检测器 | 最新论文 | HyperAI超神经