A2dele: 효율적인 RGB-D 선명 객체 탐지를 위한 적응형 및 주의 기반 깊이 증류 기법

최근의 최첨단 RGB-D 색상 객체 탐지 기법들은 RGB-D 데이터를 두 개의 스트림 아키텍처를 기반으로 탐색하며, 깊이 데이터를 처리하기 위해 별도의 하위 네트워크를 필요로 한다. 이는 불가피하게 추가적인 계산 비용과 메모리 사용량을 초래하며, 테스트 시 깊이 데이터를 사용하는 것은 RGB-D 색상 탐지 기술의 실용적 응용을 방해할 수 있다. 이러한 두 가지 과제를 해결하기 위해, 우리는 네트워크 예측과 주의 메커니즘을 두 개의 다리로 삼아 깊이 스트림에서 RGB 스트림으로 깊이 지식을 전이하는 방식을 탐구하는 깊이 디스틸러(A2dele)를 제안한다. 먼저, 깊이 스트림과 RGB 스트림에서 생성된 예측 간의 차이를 적응적으로 최소화함으로써, 픽셀 단위의 깊이 지식이 RGB 스트림으로 전이되는 것을 원하는 방식으로 제어한다. 둘째, RGB 특징에 대한 위치 정보를 전이하기 위해, 깊이 스트림의 확장된 예측과 RGB 스트림의 주의 맵 사이의 일관성을 유도한다. 그 결과, A2dele를 내장함으로써 테스트 시 깊이 데이터를 사용하지 않고도 경량화된 아키텍처를 달성할 수 있다. 다섯 가지 벤치마크에서 실시한 광범위한 실험 평가 결과, 제안한 RGB 스트림은 기존 최고 성능을 기록한 방법에 비해 모델 크기를 무려 76% 감소시키고, 실행 속도는 12배 빠르게 작동함으로써 최첨단 성능을 달성하였다. 또한, A2dele는 기존의 RGB-D 네트워크에 적용 가능하여 성능을 유지하면서도 효율성을 크게 향상시킬 수 있다(각각 DMRA에서는 FPS를 거의 두 배, CPFP에서는 세 배로 향상시킴).