
摘要
现有的计数方法通常采用基于回归的方法,无法精确地定位目标对象,这阻碍了进一步分析(例如,高级理解与细粒度分类)。此外,大多数先前的研究主要集中在静态环境中的固定摄像头对对象进行计数。鉴于无人驾驶飞行器(即无人机)的出现,我们对在动态环境中检测和计数对象产生了兴趣。为此,我们提出了布局提议网络(Layout Proposal Networks, LPNs)和空间核函数,以同时在无人机录制的视频中计数和定位目标对象(如汽车)。与传统的区域提议方法不同,我们利用了空间布局信息(例如,汽车通常规律停放),并将这些空间约束引入到我们的网络中以提高定位精度。为了评估我们的计数方法,我们提供了一个新的大规模汽车停车场数据集(CARPK),该数据集包含来自不同停车场的近90,000辆汽车。据我们所知,这是第一个也是最大的支持无人机视角下对象计数的数据集,并提供了边界框注释。