2달 전

학습의 내용과 위치: 감독 없이 위치와 식별 추적 분리하기

Manuel Traub; Sebastian Otte; Tobias Menge; Matthias Karlbauer; Jannik Thümmel; Martin V. Butz
학습의 내용과 위치: 감독 없이 위치와 식별 추적 분리하기
초록

우리의 뇌는 시각 데이터 스트림을 배경과 주요 객체로 거의 무 노력으로 분해할 수 있습니다. 또한, 객체의 움직임과 상호작용을 예측할 수 있는데, 이는 개념적 계획과 추론에 있어 중요한 능력입니다. 최근의 객체 추론 데이터셋인 CATER와 같은 사례들은 현재 비전 기반 AI 시스템이 명시적인 객체 표현, 객체 영속성, 그리고 객체 추론을 목표로 할 때 근본적인 한계를暴露出来(노출시키고) 있음을 드러냈습니다. 여기서 우리는 CATER 추적 도전 과제에서 우수한 성능을 보이는 자기 지도형 위치와 식별 추적 시스템(Loci)을 소개합니다. 뇌의 등산 경로와 복부 경로에서 영감을 받은 Loci는 '무엇'과 '어디'를 개별적으로 처리함으로써 결합 문제를 해결합니다. Loci의 예측 코딩 유사 처리는 활동적인 오류 최소화를 촉진하여, 개별 슬롯이 일반적으로 개별 객체를 인코딩하도록 합니다. 객체 간 상호작용과 객체 역학은 분리된 잠재 공간에서 처리됩니다. 시간을 통한 절단된 역전파와 전방 적격 누적이 학습 속도를 크게 향상시키고 메모리 효율성을 개선합니다. 현재 벤치마크에서 우수한 성능을 보이는 것 외에도, Loci는 비디오 스트림에서 효과적으로 객체를 추출하고 이를 위치와 겔št 컴포넌트로 분리합니다. 우리는 이러한 분리가 개념적 수준에서 효과적인 계획과 추론을 용이하게 하는 표현을 제공할 것으로 믿습니다.注:在翻译中,“暴露出来”这个词组被翻译为“노출시키고”,以适应韩语的语法结构。此外,"Gestalt" 一词在韩语中通常保留原样,因此直接使用了 "겔št"(注意这里应该是“겔št”而不是“겔스트”,因为韩文中没有“t”的发音)。

학습의 내용과 위치: 감독 없이 위치와 식별 추적 분리하기 | 최신 연구 논문 | HyperAI초신경