이 노트북 실행하기 Discord에서 논의하기

날짜

2년 전

태그

논문 URL

라이선스

MIT

GitHub

GPU 컴퓨팅 에어드롭

단 20시간의 RTX 5090 컴퓨팅 리소스 $1 (가치 $7)

지금 사용하기

대형 다중 뷰 가우시안 모델

이 튜토리얼은 LGM의 데모 구현을 제공합니다. LGM(Large Multi-View Gaussian Model)은 텍스트 입력이나 단일 뷰 이미지로부터 고해상도 3D 모델을 생성하는 혁신적인 프레임워크입니다. 이 프레임워크는 베이징대학교, 난양공과대학교 S-Lab, 상하이 인공지능 연구소의 연구원들이 논문에서 개발했습니다. LGM: 고해상도 3D 콘텐츠 제작을 위한 대형 다중 시점 가우시안 모델 본 논문에서 제안하는 LGM 프레임워크는 다중 시점 가우시안 특징을 3D 표현으로 사용하고 비대칭 U-Net을 백본 네트워크로 활용하여 높은 정확도와 효율성을 갖춘 3D 모델 생성을 구현합니다. 이 방법은 5초 이내에 3D 객체를 생성할 수 있으며, 학습 해상도를 512까지 높여 고해상도 3D 콘텐츠 생성을 가능하게 합니다.

효과 표시

실행 단계

1. 튜토리얼 컨테이너를 복제하고 성공적으로 시작한 후 아래 그림의 지침에 따라 작업 페이지로 들어가세요.

2. 사진을 업로드하거나, 프롬프트 단어를 입력하거나, 두 가지를 조합하여 3D 디스플레이 효과를 생성합니다.

이 노트북은 커뮤니티 사용자가 기여한 것으로 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp