4일 전
롱스플랫: 일상적인 긴 영상을 위한 강건한 무포즈 3D 가우시안 스플래팅
Chin-Yang Lin, Cheng Sun, Fu-En Yang, Min-Hung Chen, Yen-Yu Lin, Yu-Lun Liu

초록
긴 동영상에서 촬영된 자연스러운 장면을 대상으로 한 신규 시점 합성(Novel View Synthesis, NVS) 기술은 불규칙한 카메라 운동, 미지의 카메라 자세, 그리고 광범위한 장면 특성으로 인해 중요한 도전 과제를 안고 있다. 기존의 방법들은 자주 발생하는 자세 드리프트( pose drift), 부정확한 기하학적 초기화, 그리고 심각한 메모리 제약 등의 문제를 겪는다. 이러한 문제를 해결하기 위해 우리는 다음과 같은 세 가지 핵심 기능을 갖춘 강건한 무자세(posed) 3D 가우시안 스플래터링(3D Gaussian Splatting) 프레임워크인 LongSplat을 제안한다. (1) 동시적 증분 최적화(Incremental Joint Optimization): 카메라 자세와 3D 가우시안을 동시에 최적화함으로써 국소 최솟값에 갇히는 현상을 방지하고 전역 일관성을 보장한다. (2) 학습된 3D 사전 지식을 활용한 강건한 자세 추정 모듈(Pose Estimation Module). (3) 공간 밀도 기반으로 밀도 높은 점군을 앵커로 변환하는 효율적인 오크트리 앵커 형성 기법(Octree Anchor Formation mechanism). 다양한 도전적인 벤치마크에서 수행된 광범위한 실험 결과는 LongSplat이 기존 방법에 비해 렌더링 품질, 자세 정확도, 계산 효율성 측면에서 획기적인 성능 향상을 보였음을 입증한다. 프로젝트 페이지: https://linjohnss.github.io/longsplat/