월드 모델
인공지능 분야에서 '월드 모델'이란 환경이나 세계의 상태를 특성화하고 상태 간 전환을 예측할 수 있는 모델을 말합니다. 이 모델을 사용하면 에이전트가 시뮬레이션 환경에서 학습하고 학습한 전략을 실제 세계로 전환하여 학습 효율성을 높이고 위험을 줄일 수 있습니다.
2018년에 Jürgen Schmidhuber와 David Ha는 다음과 같은 제목의 논문을 발표했습니다.순환 세계 모델은 정책 진화를 촉진합니다"이 논문에서는 세계 모델에 대해 언급합니다. 세계 모델은 환경을 이해하고 시뮬레이션하고, 행동 전략을 학습하고, 학습한 지식을 새로운 상황에 적용할 수 있는 능력을 가지고 있습니다. 또한 현재 운동 동작을 기반으로 미래의 감각 데이터를 예측할 수 있습니다.
Yann Lecun은 2024년 2월 X 플랫폼에서 "월드 모델"을 다음과 같이 정의했습니다. 월드 모델은 인코더와 예측기를 통해 관찰, 이전 상태, 동작 및 잠재 변수를 처리하여 다음 상태를 예측하는 시퀀스 데이터를 기반으로 하는 예측 시스템입니다. 자기회귀 생성 모델은 인코더 붕괴 문제를 고려하지 않고 항등 인코더와 이산 상태를 사용하는 단순화된 형태입니다. 같은 해 3월, Lecun 연구팀은시각적 표현 학습에서 세계 모델 학습 및 활용"는 JEPA 아키텍처를 기반으로 잠재적인 복원 기술과 광도 변환을 확장한 "이미지 세계 모델(IWM)" 개념을 도입했습니다.
인공지능 기술이 지속적으로 발전함에 따라, "월드 모델"은 지능형 에이전트가 복잡한 환경을 이해하고, 미래의 사건을 예측하고, 효과적인 전략을 학습하고 이를 현실 세계에 적용하는 데 있어 핵심 도구가 될 것으로 기대됩니다.