17 天前
超高效基于AI集成智能眼镜的设备端目标检测:TinyissimoYOLO
Julian Moosmann, Pietro Bonazzi, Yawei Li, Sizhen Bian, Philipp Mayer, Luca Benini, Michele Magno

摘要
得益于前沿计算技术、加速的硬件架构以及微型人工智能算法的发展,智能眼镜正迅速实现功能升级。然而,在追求全天候使用以提供良好用户体验的前提下,将人工智能集成到外形紧凑、电池容量有限的智能眼镜中,仍面临重大挑战。本文阐述了一种微型机器学习算法的设计与实现,该算法利用新型低功耗处理器,实现了智能眼镜的长时间连续运行。研究聚焦于实时目标检测场景下智能眼镜在能效与延迟方面的优化。为此,我们构建了一款智能眼镜原型系统,作为研究平台,其包含两个微控制器:一个新型毫瓦级功耗的RISC-V并行处理器,配备用于视觉人工智能的硬件加速单元;以及一个用于通信的低功耗蓝牙模块。该智能眼镜集成了电源动态切换机制,包括图像与音频传感接口。此外,我们开发了一组基于YOLO架构的新型微型深度学习模型——TinyissimoYOLO v1.3、v5和v8,这些模型参数量低于百万级,专为基于微控制器的推理任务定制,旨在对智能眼镜上的目标检测性能进行能效与延迟的基准测试。对原型系统的评估表明,TinyissimoYOLO在单次推理中实现17毫秒的延迟,能耗仅为1.59毫焦耳,同时保持了可接受的检测精度。进一步测试显示,从图像采集到算法预测的端到端延迟为56毫秒,相当于18帧每秒的处理速率,总功耗为62.9毫瓦,对应154mAh电池可支持连续运行约9.3小时。该性能显著优于MCUNet(TinyNAS+TinyEngine)方案,后者仅执行更简单的图像分类任务,帧率仅为7.3帧每秒。