
摘要
本文研究了从单一视角检测足球的任务,特别是在球频繁与球员互动且与背景对比度较低这一具有挑战性但常见的场景中。我们提出了一种新颖的方法,通过将问题表述为由高效卷积神经网络(CNN)架构解决的分割任务来实现。为了利用球的动态特性,网络输入了一对连续的图像。我们的推理模型可以在实时运行,而不会因时间序列分析而导致延迟。此外,我们还展示了测试时数据增强可以显著提高检测精度。作为额外的贡献,我们将本研究基于的数据集公开发布。
本文研究了从单一视角检测足球的任务,特别是在球频繁与球员互动且与背景对比度较低这一具有挑战性但常见的场景中。我们提出了一种新颖的方法,通过将问题表述为由高效卷积神经网络(CNN)架构解决的分割任务来实现。为了利用球的动态特性,网络输入了一对连续的图像。我们的推理模型可以在实时运行,而不会因时间序列分析而导致延迟。此外,我们还展示了测试时数据增强可以显著提高检测精度。作为额外的贡献,我们将本研究基于的数据集公开发布。