Command Palette
Search for a command to run...
LGM 대형 다중 뷰 가우시안 모델 생성 데모
GPU 컴퓨팅 에어드롭
대형 다중 뷰 가우시안 모델

이 튜토리얼은 LGM의 데모 구현을 제공합니다. LGM(Large Multi-View Gaussian Model)은 텍스트 입력이나 단일 뷰 이미지로부터 고해상도 3D 모델을 생성하는 혁신적인 프레임워크입니다. 이 프레임워크는 베이징대학교, 난양공과대학교 S-Lab, 상하이 인공지능 연구소의 연구원들이 논문에서 개발했습니다. LGM: 고해상도 3D 콘텐츠 제작을 위한 대형 다중 시점 가우시안 모델 본 논문에서 제안하는 LGM 프레임워크는 다중 시점 가우시안 특징을 3D 표현으로 사용하고 비대칭 U-Net을 백본 네트워크로 활용하여 높은 정확도와 효율성을 갖춘 3D 모델 생성을 구현합니다. 이 방법은 5초 이내에 3D 객체를 생성할 수 있으며, 학습 해상도를 512까지 높여 고해상도 3D 콘텐츠 생성을 가능하게 합니다.
효과 표시
실행 단계
1. 튜토리얼 컨테이너를 복제하고 성공적으로 시작한 후 아래 그림의 지침에 따라 작업 페이지로 들어가세요.

2. 사진을 업로드하거나, 프롬프트 단어를 입력하거나, 두 가지를 조합하여 3D 디스플레이 효과를 생성합니다.
