vor 6 Monaten

Zusammenfassung

Intelligente Agenten müssen aus vergangenen Erfahrungen generalisieren können, um in komplexen Umgebungen ihre Ziele zu erreichen. Weltmodelle unterstützen diese Generalisierung und ermöglichen es, Verhaltensweisen anhand imaginerter Ergebnisse zu lernen, wodurch die Sample-Effizienz gesteigert wird. Während die Lernung von Weltmodellen aus Bildeingaben für bestimmte Aufgaben in letzter Zeit möglich geworden ist, blieb die genaue Modellierung von Atari-Spielen, um daraus erfolgreiche Verhaltensweisen abzuleiten, über viele Jahre eine offene Herausforderung. Wir stellen DreamerV2 vor, einen Verstärkungslern-Agenten, der Verhaltensweisen ausschließlich aus Vorhersagen im kompakten latente Raum eines leistungsfähigen Weltmodells erlernt. Das Weltmodell verwendet diskrete Darstellungen und wird separat vom Policy-Modell trainiert. DreamerV2 ist der erste Agent, der menschenniveauähliche Leistung auf dem Atari-Benchmark mit 55 Aufgaben erreicht, indem er Verhaltensweisen innerhalb eines separat trainierten Weltmodells erlernt. Mit demselben Rechenaufwand und derselben Wanduhrzeit erreicht DreamerV2 200 Millionen Frames und übertrifft die endgültige Leistung der führenden Ein-GPU-Agenten IQN und Rainbow. DreamerV2 ist zudem auf Aufgaben mit kontinuierlichen Aktionen anwendbar, bei denen es ein genaues Weltmodell eines komplexen humanoiden Roboters lernt und Stand-up- und Gehverhalten ausschließlich aus Pixel-Eingaben erlernt.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Danijar Hafner Timothy Lillicrap Mohammad Norouzi Jimmy Ba

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 6 Monaten

Danijar Hafner Timothy Lillicrap Mohammad Norouzi Jimmy Ba

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Meistern von Atari mit diskreten Weltmodellen | Paper | HyperAI

Command Palette

Meistern von Atari mit diskreten Weltmodellen

Danijar Hafner Timothy Lillicrap Mohammad Norouzi Jimmy Ba

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Meistern von Atari mit diskreten Weltmodellen

Danijar Hafner Timothy Lillicrap Mohammad Norouzi Jimmy Ba

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Meistern von Atari mit diskreten Weltmodellen

Danijar Hafner Timothy Lillicrap Mohammad Norouzi Jimmy Ba

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters