HyperAIHyperAI

Command Palette

Search for a command to run...

Textbasierte RL-Agenten mit Alltagswissen: Neue Herausforderungen, Umgebungen und Baselines

Keerthiram Murugesan Mattia Atzeni Pavan Kapanipathi Pushkar Shukla Sadhana Kumaravel Gerald Tesauro Kartik Talamadupula Mrinmaya Sachan Murray Campbell

Zusammenfassung

Textbasierte Spiele sind als wichtiger Testbereich für Forschungen im Bereich des Reinforcement Learnings (RL) hervorgetreten, da sie von RL-Agenten erfordern, sprachliche Verarbeitung auf der Grundlage von Realität mit sequentiellen Entscheidungsprozessen zu kombinieren. In dieser Arbeit untersuchen wir das Problem der Einflussnahme von Alltagswissen auf RL-Agenten. Solches Wissen würde es den Agenten ermöglichen, effizient in der Welt zu handeln, indem unwahrscheinliche Aktionen eliminiert werden, und vorausschauendes Planen durchzuführen, um festzustellen, wie aktuelle Aktionen zukünftige Weltzustände beeinflussen könnten. Wir entwerfen eine neue textbasierte Spielen-Umgebung namens TextWorld Commonsense (TWC), die zur Ausbildung und Bewertung von RL-Agenten mit einem bestimmten Typ von Alltagswissen über Objekte, ihre Eigenschaften und Handlungsmöglichkeiten dient. Zudem stellen wir mehrere Baseline-RL-Agenten vor, die den sequentiellen Kontext verfolgen und das relevante Alltagswissen dynamisch aus ConceptNet abrufen. Wir zeigen, dass Agenten, die Alltagswissen in TWC integrieren, besser abschneiden und effizienter handeln. Wir führen Nutzerstudien durch, um die menschliche Leistung bei TWC einzuschätzen und belegen dabei, dass es noch viel Raum für zukünftige Verbesserungen gibt.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp