vor 17 Tagen
Soft Actor-Critic für diskrete Aktionsräume
Petros Christodoulou

Abstract
Soft Actor-Critic ist ein modernes Verstärkungslernverfahren für kontinuierliche Aktionen, das nicht direkt auf diskrete Aktionen anwendbar ist. Viele wichtige Anwendungsfälle beinhalten jedoch diskrete Aktionen. Hier leiten wir daher eine alternative Version des Soft Actor-Critic-Algorithmus ab, die auf diskrete Aktionen anwendbar ist. Wir zeigen, dass dieser Algorithmus – selbst ohne jegliche Hyperparameter-Tuning – bereits auf einer Auswahl von Spielen aus der Atari-Suite mit dem getunten, modellfreien Stand der Technik konkurrieren kann.