HyperAIHyperAI
vor 17 Tagen

Soft Actor-Critic für diskrete Aktionsräume

Petros Christodoulou
Soft Actor-Critic für diskrete Aktionsräume
Abstract

Soft Actor-Critic ist ein modernes Verstärkungslernverfahren für kontinuierliche Aktionen, das nicht direkt auf diskrete Aktionen anwendbar ist. Viele wichtige Anwendungsfälle beinhalten jedoch diskrete Aktionen. Hier leiten wir daher eine alternative Version des Soft Actor-Critic-Algorithmus ab, die auf diskrete Aktionen anwendbar ist. Wir zeigen, dass dieser Algorithmus – selbst ohne jegliche Hyperparameter-Tuning – bereits auf einer Auswahl von Spielen aus der Atari-Suite mit dem getunten, modellfreien Stand der Technik konkurrieren kann.