Command Palette
Search for a command to run...
월드젠: 텍스트에서 탐색 가능하고 상호작용 가능한 3D 세계로
월드젠: 텍스트에서 탐색 가능하고 상호작용 가능한 3D 세계로
초록
우리는 텍스트 프롬프트로부터 대규모이고 상호작용 가능한 3D 세계를 자동으로 생성할 수 있는 시스템인 WorldGen을 소개한다. 본 연구에서 제안하는 방법은 자연어 기술을 활용해 탐색이 가능하고 완전히 텍스처화된 환경을 생성하며, 이를 표준 게임 엔진에서 즉시 탐색하거나 편집할 수 있도록 한다. LLM 기반의 장면 레이아웃 추론, 절차적 생성, 확산 기반 3D 생성, 객체 인식 기반 장면 분해를 결합함으로써 WorldGen은 창의적 의도와 기능적인 가상 공간 사이의 격차를 메우며, 수동 모델링이나 전문적인 3D 기술 없이도 일관성 있고 탐색 가능한 세계를 설계할 수 있도록 한다. 이 시스템은 완전히 모듈러하며, 레이아웃, 스케일, 스타일에 대한 세밀한 제어를 지원하여 기하학적으로 일관성 있고 시각적으로 풍부하며 실시간 렌더링에 효율적인 세계를 생성한다. 본 연구는 대규모에서 접근 가능한 생성형 세계 구축의 가능성을 제시하며, 게임, 시뮬레이션, 몰입형 사회 환경 등 다양한 분야에 적용되는 3D 생성형 AI의 경계를 한층 더 넓히는 계기를 마련한다.