HyperAIHyperAI

Command Palette

Search for a command to run...

Meistern von Atari mit diskreten Weltmodellen

Danijar Hafner Timothy Lillicrap Mohammad Norouzi Jimmy Ba

Zusammenfassung

Intelligente Agenten müssen aus vergangenen Erfahrungen generalisieren können, um in komplexen Umgebungen ihre Ziele zu erreichen. Weltmodelle unterstützen diese Generalisierung und ermöglichen es, Verhaltensweisen anhand imaginerter Ergebnisse zu lernen, wodurch die Sample-Effizienz gesteigert wird. Während die Lernung von Weltmodellen aus Bildeingaben für bestimmte Aufgaben in letzter Zeit möglich geworden ist, blieb die genaue Modellierung von Atari-Spielen, um daraus erfolgreiche Verhaltensweisen abzuleiten, über viele Jahre eine offene Herausforderung. Wir stellen DreamerV2 vor, einen Verstärkungslern-Agenten, der Verhaltensweisen ausschließlich aus Vorhersagen im kompakten latente Raum eines leistungsfähigen Weltmodells erlernt. Das Weltmodell verwendet diskrete Darstellungen und wird separat vom Policy-Modell trainiert. DreamerV2 ist der erste Agent, der menschenniveauähliche Leistung auf dem Atari-Benchmark mit 55 Aufgaben erreicht, indem er Verhaltensweisen innerhalb eines separat trainierten Weltmodells erlernt. Mit demselben Rechenaufwand und derselben Wanduhrzeit erreicht DreamerV2 200 Millionen Frames und übertrifft die endgültige Leistung der führenden Ein-GPU-Agenten IQN und Rainbow. DreamerV2 ist zudem auf Aufgaben mit kontinuierlichen Aktionen anwendbar, bei denen es ein genaues Weltmodell eines komplexen humanoiden Roboters lernt und Stand-up- und Gehverhalten ausschließlich aus Pixel-Eingaben erlernt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp