HyperAI

세계 3대 컴퓨터 비전 학회 중 하나인 CVPR 2025가 6월 13일 최우수 논문상을 발표했습니다. 공식 자료에 따르면, CVPR 2025에는 4만 명 이상의 저자가 제출한 13,008편의 논문이 접수되었으며, 이는 작년 대비 131편(TP3T) 증가한 수치입니다.이 학회에서는 최종적으로 2,872편의 논문이 접수되었으며, 전반적인 접수율은 약 22.1%였습니다.

최종 선정된 약 3,000편의 논문 중 단 한 편만이 우수 논문상을 수상했습니다. 그 가치가 얼마나 큰지 짐작하실 수 있을 겁니다.이 성과는 옥스포드 대학과 Meta AI가 공동으로 제안한 순수 피드포워드 트랜스포머 아키텍처를 기반으로 한 일반 3D 비전 모델 VGGT입니다.이 모델은 단일 작업에만 국한되었던 기존 모델의 문제점을 극복하고 카메라 매개변수, 포인트 맵, 깊이 맵, 3D 포인트 트랙을 포함하여 하나, 여러 개 또는 수백 개의 관점에서 장면의 모든 주요 3D 속성을 직접 추론할 수 있습니다.

* 논문 제목:「VGGT: 시각 기하학 접지 변압기"

* 논문 링크:https://go.hyper.ai/Nmgxd

더 중요한 점은, 이 방법이 간단하고 효율적이라는 것입니다.1초 이내에 이미지 재구성을 완료할 수 있습니다.VGGT의 성능은 시각적 기하 최적화 후처리 기법에 의존하는 다른 대안들보다 뛰어납니다. 실험 결과에 따르면 VGGT는 카메라 매개변수 추정, 다시점 깊이 추정, 고밀도 포인트 클라우드 재구성, 3D 포인트 추적을 포함한 여러 3D 작업에서 SOTA 수준의 성능을 달성했습니다.

현재,HyperAI의 튜토리얼 섹션 Hyper.ai는 "VGGT: 범용 3D 비전 모델"을 출시했습니다.원클릭 배포 경험 효과를 지원하며, 이 획기적인 기술의 강력한 힘을 직접 느껴보세요⬇️

* 튜토리얼 링크:https://go.hyper.ai/GX3bC

데모 실행

1. hyper.ai 홈페이지에 접속한 후, "튜토리얼" 페이지를 선택하고, "VGGT: 일반 3D 비전 모델"을 선택한 후, "이 튜토리얼을 온라인으로 실행"을 클릭하세요.

2. 페이지가 이동한 후 오른쪽 상단의 "복제"를 클릭하여 튜토리얼을 자신의 컨테이너로 복제합니다.

3. "NVIDIA RTX 4090" 및 "PyTorch" 이미지를 선택하세요. OpenBayes 플랫폼은 4가지 결제 방식을 제공합니다. 필요에 따라 "종량제" 또는 "일/주/월" 결제를 선택할 수 있습니다. "계속"을 클릭하세요. 신규 사용자는 아래 초대 링크를 통해 등록하시면 RTX 4090 4시간 + CPU 무료 사용 시간 5시간을 받으실 수 있습니다!

HyperAI 독점 초대 링크(복사하여 브라우저에서 열기):

https://openbayes.com/console/signup?r=Ada0322_NR0n

4. 리소스가 할당될 때까지 기다리세요. 첫 번째 클로닝 과정은 약 2분이 걸립니다. 상태가 "실행 중"으로 변경되면 "API 주소" 옆에 있는 점프 화살표를 클릭하여 데모 페이지로 이동합니다. 모델이 크기 때문에 WebUI 인터페이스를 표시하는 데 약 3분이 걸리며, 그렇지 않으면 "잘못된 게이트웨이"가 표시됩니다. API 주소 접근 기능을 이용하기 위해서는 이용자가 실명인증을 완료해야 합니다.

효과 시연

1. 아래와 같이 API 주소를 클릭하여 데모 페이지로 이동하여 모델을 경험해 보세요.

2. 튜토리얼에 예시를 준비했습니다. 아래 그림과 같이 예시를 클릭하면 모델 효과를 직접 체험해 보실 수 있습니다.

이 글은 이번 호에 추천하는 튜토리얼입니다. 여러분 모두 직접 체험해 보세요⬇️

* 튜토리얼 링크:https://go.hyper.ai/GX3bC

Command Palette

온라인 튜토리얼 | CVPR 2025 최우수 논문 수상, 범용 3D 비전 모델 VGGT 추론 속도 초당 1000회까지 가능

데모 실행

효과 시연