2달 전

좌우 구분: 기하학적 의미 대응 식별

Zhang, Junyi ; Herrmann, Charles ; Hur, Junhwa ; Chen, Eric ; Jampani, Varun ; Sun, Deqing ; Yang, Ming-Hsuan
좌우 구분: 기하학적 의미 대응 식별
초록

대규모 사전 학습 시각 모델들은 의미적 대응에 있어 상당한 잠재력을 보여주고 있지만, 이들의 특성은 종종 인스턴스의 기하학적 구조와 방향성을 파악하는 데 어려움을 겪습니다. 본 논문에서는 의미적 대응을 위해 기하학적 인식의 중요성을 밝히고, 현재의 기초 모델들이 간단한 후처리 과정에서도 특성의 한계를 드러내는 문제점을 지적합니다. 우리는 이러한 정보를 통합하면, zero-shot 및 감독된 설정에서 모두 간단하면서도 효과적인 해결책으로 의미적 대응 성능을 크게 향상시킬 수 있음을 보여줍니다. 또한, 기존 동물 자세 추정 데이터셋을 활용하여 사전 학습 및 모델 검증을 위한 새로운 도전적인 벤치마크를 구성하였습니다. 우리의 방법은 어려운 SPair-71k 데이터셋에서 [email protected] 점수로 65.4(제로샷)와 85.6(감독)를 달성하여, 각각 5.5%p와 11.0%p의 절대적인 성능 향상을 이룩하였습니다. 우리의 코드와 데이터셋은 다음 주소에서 공개적으로 이용 가능합니다: https://telling-left-from-right.github.io/.

좌우 구분: 기하학적 의미 대응 식별 | 최신 연구 논문 | HyperAI초신경