Command Palette
Search for a command to run...
Q-Lernen
Q-Learning ist ein Reinforcement-Learning-Algorithmus, der entwickelt wurde, um eine Aktionswertfunktion Q zu lernen. Diese Funktion bewertet die erwarteten Rückgewinne, die durch das Ausführen einer spezifischen Aktion in einem bestimmten Zustand erzielt werden. Das Kernziel von Q-Learning besteht darin, dem Agenten zu ermöglichen, in verschiedenen Situationen autonome Entscheidungen zu treffen und Aktionen auszuwählen, die kumulative Belohnungen maximieren. Dies führt zu effizientem Lernen und Anpassung in dynamischen Umgebungen. Q-Learning benötigt kein Modell der Umgebung, was es hochgradig generalisierbar macht und für Anwendungen wertvoll rendert. Es wird in Bereichen wie Spielen und Roboter-Navigation weitgehend eingesetzt.