HyperAI

Offline-Meta-RL

Offline-Meta-RL ist eine neue Forschungsrichtung, die Offline-Verstärkungslernen (Offline-RL) und Meta-Verstärkungslernen (Meta-RL) kombiniert. Dieses Konzept wurde erstmals im Jahr 2020 vom DeepMind-Forschungsteam vorgeschlagen und in der Arbeit „Offline-Meta-Verstärkungslernen" wird im Detail in " erläutert. Ziel ist es, Offline-Daten (d. h. im Voraus erfasste Daten, die nicht von Online-Interaktionen abhängig sind) zum Trainieren von Modellen zu nutzen, sodass diese sich schnell an neue Aufgaben oder neue Umgebungen anpassen können, ohne dass umfangreiche Online-Interaktionen erforderlich sind. Dieser Ansatz eignet sich besonders für Szenarien, in denen die Kosten oder Risiken der Online-Interaktion hoch sind, wie etwa im medizinischen Bereich und beim autonomen Fahren.