HyperAIHyperAI

Steuerung mit parametrisierten Aktionen

In der Forschung zum Reinforcement Learning konzentrieren sich die meisten Arbeiten auf das Verhalten von Agenten in diskreten oder kontinuierlichen Aktionssräumen. Bei der Ausbildung von Agenten, um Videospiele zu spielen, ist es jedoch oft erforderlich, mit komplexen Aktionen umzugehen, die sowohl diskrete als auch kontinuierliche Komponenten haben. Diese Art von Aufgabe wird als "Kontrolle mit parametrisierten Aktionen" bezeichnet. Sie zielt darauf ab, Algorithmen zu entwickeln, die Agenten ermöglichen, gleichzeitig diskretes Entscheidungsfinden und kontinuierliche Parameteroptimierung durchzuführen, um so effizientes Lernen und Handeln in komplexen Umgebungen zu erreichen. Der Anwendungswert dieser Aufgabe besteht darin, die Anpassungsfähigkeit und Flexibilität der Agenten in multimodalen interaktiven Umgebungen wie Spielen zu verbessern.

Steuerung mit parametrisierten Aktionen | SOTA | HyperAI