
다중 시점 스테레오 (MVS)는 알려진 카메라 매개변수를 사용할 때, 유효한 깊이 범위 내에서의 1차원 탐색 문제로 귀결됩니다. 최근의 딥러닝 기반 MVS 방법들은 일반적으로 깊이 범위에서 밀도 높게 깊이 가설을 샘플링하고, 이를 통해 메모리 소비가 심각한 3D 비용 체적을 구축하여 깊이 예측을 수행합니다. 효율적인 샘플링 전략들이 이 문제를 일정 정도 완화시키기는 하지만, MVS의 효율성은 여전히 해결되지 않은 과제입니다. 본 연구에서는 메모리 사용량을 크게 줄이는 동시에 최신의 깊이 예측 성능을 명확히 향상시키는 새로운 고효율 MVS 방법을 제안합니다. 우리는 효율성과 효과성을 모두 고려할 때 MVS에 대해 어떤 탐색 전략이 합리적으로 최적일 수 있는지를 조사하였습니다. 먼저, MVS를 이진 탐색 문제로 정식화하고, 이에 따라 일반화된 이진 탐색 네트워크를 제안하였습니다. 구체적으로, 각 단계에서 깊이 범위는 양쪽에 추가적인 1개의 오류 용인 범위를 포함하여 2개의 구간으로 나뉩니다. 분류 작업을 통해 실제 깊이가 포함된 구간을 식별합니다. 또한, 분류 오류 처리, 범위 외 샘플 대응 및 훈련 메모리 감소를 각각 위한 세 가지 메커니즘을 설계하였습니다. 새로운 정식화 방식은 우리의 방법이 각 단계에서 매우 적은 수의 깊이 가설만 샘플링하도록 하여 메모리 효율성이 매우 높아지며, 빠른 훈련 수렴도 크게 촉진합니다. 경쟁력 있는 벤치마크에서 수행한 실험 결과, 우리의 방법은 훨씬 적은 메모리를 사용하면서도 최고 수준의 정확도를 달성하였습니다. 특히, DTU 데이터셋에서 전체 점수가 0.289를 기록하였으며, 모든 딥러닝 기반 방법들 중 가장 어려운 Tanks and Temples 고급 데이터셋에서 1등을 차지하였습니다. 훈련된 모델과 코드는 https://github.com/MiZhenxing/GBi-Net 에서 공개될 예정입니다.