HyperAIHyperAI

Command Palette

Search for a command to run...

Soft Actor-Critic für diskrete Aktionsräume

Petros Christodoulou

Zusammenfassung

Soft Actor-Critic ist ein modernes Verstärkungslernverfahren für kontinuierliche Aktionen, das nicht direkt auf diskrete Aktionen anwendbar ist. Viele wichtige Anwendungsfälle beinhalten jedoch diskrete Aktionen. Hier leiten wir daher eine alternative Version des Soft Actor-Critic-Algorithmus ab, die auf diskrete Aktionen anwendbar ist. Wir zeigen, dass dieser Algorithmus – selbst ohne jegliche Hyperparameter-Tuning – bereits auf einer Auswahl von Spielen aus der Atari-Suite mit dem getunten, modellfreien Stand der Technik konkurrieren kann.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp