
摘要
本文描述了一种基于深度网络的物体检测器,专门用于长镜头视频中的球体检测。由于其全卷积设计,该方法可以处理任意尺寸的图像,并生成\emph{球体置信图}(ball confidence map),编码所检测到球体的位置。网络采用了超列(hypercolumn)概念,即将深度卷积网络不同层次的特征图进行组合,并共同输入到卷积分类层中。这使得检测精度得以提升,因为更大范围的视觉上下文被纳入了考虑。该方法在公开可用的ISSIA-CNR足球数据集上测试时,达到了当前最先进的结果。
本文描述了一种基于深度网络的物体检测器,专门用于长镜头视频中的球体检测。由于其全卷积设计,该方法可以处理任意尺寸的图像,并生成\emph{球体置信图}(ball confidence map),编码所检测到球体的位置。网络采用了超列(hypercolumn)概念,即将深度卷积网络不同层次的特征图进行组合,并共同输入到卷积分类层中。这使得检测精度得以提升,因为更大范围的视觉上下文被纳入了考虑。该方法在公开可用的ISSIA-CNR足球数据集上测试时,达到了当前最先进的结果。