Weltmodelle
Im Bereich der künstlichen Intelligenz ist ein „Weltmodell“ ein Modell, das den Zustand der Umgebung oder der Welt charakterisieren und Übergänge zwischen Zuständen vorhersagen kann. Dieses Modell ermöglicht es dem Agenten, in einer simulierten Umgebung zu lernen und die erlernten Strategien auf die reale Welt zu übertragen, wodurch die Lerneffizienz verbessert und Risiken reduziert werden.
Im Jahr 2018 veröffentlichten Jürgen Schmidhuber und David Ha eine Arbeit mit dem TitelRekurrierende Weltmodelle erleichtern die Politikentwicklung„Das Weltmodell wird im Artikel erwähnt. Es besitzt die Fähigkeit, die Umgebung zu verstehen und zu simulieren, Verhaltensstrategien zu erlernen und erlerntes Wissen auf neue Situationen zu übertragen. Es kann zukünftige sensorische Daten basierend auf aktuellen motorischen Aktionen vorhersagen.“
Yann Lecun definierte „Weltmodell“ in der X-Plattform im Februar 2024 wie folgt: Ein Weltmodell ist ein auf Sequenzdaten basierendes Vorhersagesystem, das Beobachtungen, vorherige Zustände, Aktionen und latente Variablen durch Encoder und Prädiktoren verarbeitet, um den nächsten Zustand vorherzusagen. Das autoregressive generative Modell ist eine vereinfachte Form davon, die einen Identitätscodierer und diskrete Zustände verwendet, ohne das Problem des Encoderkollapses zu berücksichtigen. Im März desselben Jahres veröffentlichte Lecuns Forschungsteam eine Arbeit mit dem TitelLernen und Nutzen von Weltmodellen beim Lernen visueller Darstellungen„führte das Konzept der „Image World Models (IWM)“ ein, das auf der JEPA-Architektur basiert und die potenzielle Restaurierungstechnologie und photometrische Transformation erweitert.
Mit der kontinuierlichen Weiterentwicklung der künstlichen Intelligenz wird erwartet, dass das „Weltmodell“ zu einem wichtigen Werkzeug für intelligente Agenten wird, um komplexe Umgebungen zu verstehen, zukünftige Ereignisse vorherzusagen, effektive Strategien zu erlernen und diese in der realen Welt anzuwenden.