HyperAIHyperAI

Command Palette

Search for a command to run...

Benchmarking Deep Reinforcement Learning für kontinuierliche Steuerung

Duan Yan Chen Xi Houthooft Rein Schulman John Abbeel Pieter

Zusammenfassung

Kürzlich haben Forscher erhebliche Fortschritte bei der Kombination der Fortschritte in der tiefen Lernverfahren zur Lernung von Merkmalsdarstellungen mit der Verstärkungslernmethodik erzielt. Bekannte Beispiele hierfür sind die Trainings von Agenten zum Spielen von Atari-Spielen anhand von Rohpixel-Daten sowie die Entwicklung fortgeschrittener Manipulationsfähigkeiten mittels roher Sinnesdaten. Aufgrund des Fehlens eines allgemein akzeptierten Benchmark-Tests war jedoch die Quantifizierung von Fortschritten im Bereich der kontinuierlichen Steuerung bisher schwierig. In dieser Arbeit stellen wir eine Benchmark-Suite kontinuierlicher Steuerungsaufgaben vor, die klassische Aufgaben wie das Aufschwingen des Pendelwagens (cart-pole swing-up), Aufgaben mit sehr hoher Zustands- und Aktionsdimensionalität wie die 3D-Lokomotion eines menschenähnlichen Roboters, Aufgaben mit partiellen Beobachtungen sowie Aufgaben mit hierarchischer Struktur umfassen. Auf Basis einer systematischen Evaluation einer Vielzahl implementierter Verstärkungslernalgorithmen berichten wir über neuartige Erkenntnisse. Die Benchmark sowie die Referenzimplementierungen werden unter https://github.com/rllab/rllab veröffentlicht, um die experimentelle Reproduzierbarkeit zu fördern und die Nutzung durch weitere Forscher zu unterstützen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Benchmarking Deep Reinforcement Learning für kontinuierliche Steuerung | Paper | HyperAI