2 个月前

通过连接片段在自然图像中检测定向文本

Shi, Baoguang ; Bai, Xiang ; Belongie, Serge
通过连接片段在自然图像中检测定向文本
摘要

大多数最先进的文本检测方法都专门针对水平拉丁文文本,并且速度不足以满足实时应用的需求。我们提出了一种称为段链接(Segment Linking, SegLink)的倾斜文本检测方法。该方法的主要思想是将文本分解为两个局部可检测的元素,即段和链接。段是一个覆盖单词或文本行部分区域的倾斜框;链接则连接两个相邻的段,表明它们属于同一个单词或文本行。这两种元素通过一个端到端训练的全卷积神经网络在多个尺度上密集地进行检测。最终的检测结果由通过链接连接起来的段组合而成。与先前的方法相比,SegLink在准确性、速度和训练简便性方面都有所提升。它在标准ICDAR 2015偶发场景(Challenge 4)基准测试中达到了75.0%的F值,大幅超过了之前的最佳结果。该方法在512x512图像上的运行速度超过20帧每秒。此外,无需任何修改,SegLink就能够检测长行非拉丁文文本,例如中文。

通过连接片段在自然图像中检测定向文本 | 最新论文 | HyperAI超神经