11 天前

FishEye8K:鱼眼相机目标检测的基准与数据集

Munkhjargal Gochoo, Munkh-Erdene Otgonbold, Erkhembayar Ganbold, Jun-Wei Hsieh, Ming-Ching Chang, Ping-Yang Chen, Byambaa Dorj, Hamad Al Jassmi, Ganzorig Batnasan, Fady Alnajjar, Mohammed Abduljabbar, Fang-Pang Lin
FishEye8K:鱼眼相机目标检测的基准与数据集
摘要

随着人工智能技术的发展,道路目标检测已成为计算机视觉领域的研究热点,传统方法主要依赖于透视相机。鱼眼镜头能够以更少的摄像头实现道路交叉口的全景广域覆盖,但其视场存在显著的图像畸变。据我们所知,目前尚无公开可用的、专为鱼眼摄像头交通监控任务构建的数据集。本文提出一个开放的 FishEye8K 基准数据集,用于道路目标检测任务,包含五个类别(行人、自行车、小汽车、公交车和卡车)共计15.7万个边界框标注。此外,本文还提供了多种前沿检测模型的基准测试结果,涵盖 YOLOv5、YOLOR、YOLOv7 和 YOLOv8 等系列模型的多种变体。该数据集由台湾新竹地区使用18个鱼眼摄像头采集的22段视频组成,共包含8,000张图像,图像分辨率为1080×1080和1280×1280。由于鱼眼图像具有超广角全景与半球形视场,畸变严重,且道路上参与者众多,尤其是骑乘电动自行车的人群,因此数据标注与验证过程极为复杂且耗时。为避免数据偏差,来自同一摄像头的帧被统一划分至训练集或测试集,确保每个类别在图像数量与边界框数量上均保持约70:30的训练与测试比例。实验结果表明,在输入尺寸为640×640时,YOLOv8表现更优;而在1280×1280输入尺寸下,YOLOR展现出更强的检测性能。该数据集将通过 GitHub 公开发布,并提供 PASCAL VOC、MS COCO 以及 YOLO 三种主流标注格式。FishEye8K 基准数据集的发布,将为鱼眼视频分析与智慧城市应用等领域提供重要支持,推动相关技术的发展与落地。

FishEye8K:鱼眼相机目标检测的基准与数据集 | 最新论文 | HyperAI超神经