AI 통합 스마트 안경에서 초효율적인 장치 내 객체 탐지: TinyissimoYOLO

스마트 안경은 최첨단 컴퓨팅 기술, 가속화된 하드웨어 아키텍처, 그리고 소형 AI 알고리즘의 발전으로 인해 빠르게 고도화된 기능을 갖추고 있다. 그러나 소형 구조와 제한된 배터리 용량을 가진 스마트 안경에 AI를 통합하는 것은 만족스러운 사용자 경험을 위해 하루 종일 지속적인 사용을 목표로 할 때 여전히 도전 과제이다. 본 논문은 저전력 신규 프로세서를 활용한 소형 기계학습 알고리즘의 설계 및 구현을 제시하며, 스마트 안경에서 장시간 연속 작동을 가능하게 한다. 특히 실시간 물체 탐지 상황에서 에너지 효율성과 지연 시간 최적화를 고려하여 스마트 안경의 효율성을 탐구한다. 이를 위해, 새로운 밀리와트 수준의 전력 소비를 가지는 RISC-V 병렬 프로세서(시각 AI용 하드웨어 가속기 탑재)와 블루투스 저전력 통신 모듈을 내장한 두 개의 마이크로컨트롤러를 갖춘 스마트 안경 프로토타입을 개발하였다. 이 안경은 이미지 및 음성 센싱 인터페이스를 포함한 전력 사이클링 메커니즘을 통합하고 있다. 또한, 마이크로컨트롤러 기반 추론을 위해 최적화된 YOLO 기반의 소형 딥러닝 모델군인 TinyissimoYOLO v1.3, v5, v8을 개발하였으며, 이는 에너지 소비와 지연 시간 측면에서 스마트 안경을 활용한 물체 탐지의 벤치마킹을 목적으로 한다. 프로토타입에 대한 평가 결과, TinyissimoYOLO는 추론당 17ms의 지연 시간과 1.59mJ의 에너지 소비를 달성하면서도 충분한 탐지 정확도를 유지함을 확인하였다. 추가 평가에서는 이미지 캡처부터 알고리즘 예측까지의 엔드투엔드 지연 시간이 56ms(즉, 초당 18프레임)이며, 총 전력 소비는 62.9mW로, 154mAh 배터리 기준 약 9.3시간의 연속 작동 시간을 제공함을 확인하였다. 이러한 성능은 더 단순한 작업(이미지 분류)을 수행하는 MCUNet(TinyNAS+TinyEngine)보다 우수하며, 그 성능은 단지 초당 7.3프레임에 불과하다.