17 天前

超高效基于AI集成智能眼镜的设备端目标检测：TinyissimoYOLO

Julian Moosmann, Pietro Bonazzi, Yawei Li, Sizhen Bian, Philipp Mayer, Luca Benini, Michele Magno

摘要

得益于前沿计算技术、加速的硬件架构以及微型人工智能算法的发展，智能眼镜正迅速实现功能升级。然而，在追求全天候使用以提供良好用户体验的前提下，将人工智能集成到外形紧凑、电池容量有限的智能眼镜中，仍面临重大挑战。本文阐述了一种微型机器学习算法的设计与实现，该算法利用新型低功耗处理器，实现了智能眼镜的长时间连续运行。研究聚焦于实时目标检测场景下智能眼镜在能效与延迟方面的优化。为此，我们构建了一款智能眼镜原型系统，作为研究平台，其包含两个微控制器：一个新型毫瓦级功耗的RISC-V并行处理器，配备用于视觉人工智能的硬件加速单元；以及一个用于通信的低功耗蓝牙模块。该智能眼镜集成了电源动态切换机制，包括图像与音频传感接口。此外，我们开发了一组基于YOLO架构的新型微型深度学习模型——TinyissimoYOLO v1.3、v5和v8，这些模型参数量低于百万级，专为基于微控制器的推理任务定制，旨在对智能眼镜上的目标检测性能进行能效与延迟的基准测试。对原型系统的评估表明，TinyissimoYOLO在单次推理中实现17毫秒的延迟，能耗仅为1.59毫焦耳，同时保持了可接受的检测精度。进一步测试显示，从图像采集到算法预测的端到端延迟为56毫秒，相当于18帧每秒的处理速率，总功耗为62.9毫瓦，对应154mAh电池可支持连续运行约9.3小时。该性能显著优于MCUNet（TinyNAS+TinyEngine）方案，后者仅执行更简单的图像分类任务，帧率仅为7.3帧每秒。