Command Palette
Search for a command to run...
Benchmarking Deep Reinforcement Learning für kontinuierliche Steuerung
Benchmarking Deep Reinforcement Learning für kontinuierliche Steuerung
Duan Yan Chen Xi Houthooft Rein Schulman John Abbeel Pieter
Zusammenfassung
Kürzlich haben Forscher erhebliche Fortschritte bei der Kombination der Fortschritte in der tiefen Lernverfahren zur Lernung von Merkmalsdarstellungen mit der Verstärkungslernmethodik erzielt. Bekannte Beispiele hierfür sind die Trainings von Agenten zum Spielen von Atari-Spielen anhand von Rohpixel-Daten sowie die Entwicklung fortgeschrittener Manipulationsfähigkeiten mittels roher Sinnesdaten. Aufgrund des Fehlens eines allgemein akzeptierten Benchmark-Tests war jedoch die Quantifizierung von Fortschritten im Bereich der kontinuierlichen Steuerung bisher schwierig. In dieser Arbeit stellen wir eine Benchmark-Suite kontinuierlicher Steuerungsaufgaben vor, die klassische Aufgaben wie das Aufschwingen des Pendelwagens (cart-pole swing-up), Aufgaben mit sehr hoher Zustands- und Aktionsdimensionalität wie die 3D-Lokomotion eines menschenähnlichen Roboters, Aufgaben mit partiellen Beobachtungen sowie Aufgaben mit hierarchischer Struktur umfassen. Auf Basis einer systematischen Evaluation einer Vielzahl implementierter Verstärkungslernalgorithmen berichten wir über neuartige Erkenntnisse. Die Benchmark sowie die Referenzimplementierungen werden unter https://github.com/rllab/rllab veröffentlicht, um die experimentelle Reproduzierbarkeit zu fördern und die Nutzung durch weitere Forscher zu unterstützen.