HyperAIHyperAI

Command Palette

Search for a command to run...

MG-Nav: 희소 공간 기억을 통한 이중 규모 시각 탐색

Bo Wang Jiehong Lin Chenzhi Liu Xinting Hu Yifei Yu Tianjia Liu Zhongrui Wang Xiaojuan Qi

초록

우리는 글로벌 메모리 기반 계획과 로컬 기하학적 강화 제어를 통합하는 제로샷 시각적 탐색을 위한 이중 스케일 프레임워크인 MG-Nav(Memory-Guided Navigation)를 제안한다. 이 프레임워크의 핵심은 희소 공간 메모리 그래프(Sparse Spatial Memory Graph, SMG)로, 각 노드는 다중 시점 키프레임 및 객체 의미 정보를 집약하여 외관과 공간 구조를 동시에 포착하면서도 시점 다양성을 유지하는 컴팩트하고 영역 중심의 메모리 구조이다. 글로벌 수준에서는 에이전트가 SMG 상에서 국소화되며, 이미지-인스턴스 하이브리드 검색을 통해 목표 조건부 노드 경로를 계획하여 장거리 탐색을 위한 도달 가능한 웨이포인트 시퀀스를 생성한다. 로컬 수준에서는 네비게이션 기반 정책이 이러한 웨이포인트를 포인트-목표 모드로 실행하며 장애물 인식 기반 제어를 수행하며, 최종 노드에서 시각적 목표로 이동할 때는 이미지-목표 모드로 전환한다. 또한 관측 및 목표 특징을 공유된 3D 인식 공간에서 정렬함으로써 시점 일치 및 목표 인식 성능을 더욱 향상시키기 위해, 사전 학습된 VGGT 모델 기반의 경량 기하 모듈인 VGGT-adapter를 도입한다. MG-Nav는 글로벌 계획과 로컬 제어를 서로 다른 주기로 수행하며, 주기적인 재국소화를 통해 오차를 보정한다. HM3D Instance-Image-Goal 및 MP3D Image-Goal 벤치마크에서의 실험 결과, MG-Nav는 제로샷 성능에서 최신 기준을 달성하며, 동적 재배치 및 미지의 장면 조건에서도 뛰어난 강건성을 유지함을 입증하였다.


AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
MG-Nav: 희소 공간 기억을 통한 이중 규모 시각 탐색 | 문서 | HyperAI초신경