HyperAIHyperAI

Command Palette

Search for a command to run...

확률적 구조 통합을 통한 월드 모델링

Klemen Kotar Wanhee Lee Rahul Venkatesh Honglin Chen Daniel Bear et al

초록

우리는 데이터로부터 풍부한 제어성과 유연한 프롬프트 가능성을 갖춘 세계 모델을 학습하기 위한 시스템인 확률적 구조 통합(Probabilistic Structure Integration, PSI)을 제안한다. PSI는 세 단계 주기로 구성된다. 첫 번째 단계인 확률적 예측에서는, 데이터에 대한 확률적 그래픽 모델인 Ψ를 구축한다. 이 Ψ는 무작위 접근 가능한 자기회귀 시퀀스 모델의 형태로 표현되며, 데이터 내 임의의 변수들이 다른 임의의 변수 집합에 따라 어떻게 의존하는지를 설명하는 학습된 조건부 분포의 완전한 집합을 지원한다. 두 번째 단계인 구조 추출에서는, Ψ에 대한 인과 추론을 통해 제로샷(zero-shot) 방식으로 데이터 내에 내재된 저차원적 특성, 즉 다양한 의미 있는 '중간 구조(middle structures)'를 추출할 수 있음을 보여준다. 세 번째 단계인 통합에서는, 이러한 구조들을 새로운 토큰 유형으로 변환하고, 이를 지속적으로 학습 데이터에 포함시켜 조건부 신호 및 예측 대상으로 활용함으로써 주기를 완성한다. 이러한 각 주기마다 Ψ의 능력이 향상되며, 데이터의 내부 구조를 더 잘 모델링할 수 있게 되고, 동시에 새로운 제어 수단이 생성된다. 이는 마치 대규모 언어 모델(LLM)과 유사한 보편적인 프롬프팅 언어와 같은 기능을 제공한다. 우리는 인터넷 영상 데이터 1.4조 토큰을 기반으로 PSI의 구현체를 학습하였으며, 이를 활용해 다양한 유용한 영상 예측 및 이해 추론을 수행하였다. 또한 최첨단의 광학 흐름(optical flow), 자기지도형 깊이(depth) 추정 및 객체 세그멘테이션을 추출하였으며, 이러한 구조들을 활용하여 예측 성능 향상의 완전한 주기를 달성하였다.


AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
확률적 구조 통합을 통한 월드 모델링 | 문서 | HyperAI초신경