
摘要
传统的文本检测方法大多集中在矩形文本上。本研究提出了一种名为滑动线点回归(Sliding Line Point Regression, SLPR)的新方法,以在自然场景中检测任意形状的文本。SLPR通过回归文本行边缘上的多个点,然后利用这些点勾勒出文本的轮廓。所提出的SLPR可以适应多种目标检测架构,如Faster R-CNN和R-FCN。具体而言,我们首先使用区域提议网络(Region Proposal Network, RPN)生成包含文本的最小矩形框,然后通过垂直和水平滑动线等距回归文本边缘上的点。为了充分利用信息并减少冗余,我们根据矩形框的位置计算目标点的x坐标或y坐标,仅回归剩余的y坐标或x坐标。因此,我们不仅可以减少系统的参数量,还可以限制生成的点,从而形成更加规则的多边形。我们的方法在传统的ICDAR2015非故意场景文本基准数据集和曲线文本检测数据集CTW1500上取得了具有竞争力的结果。