ReAct-Framework
Das ReAct-Framework wurde von Yao Shunyu und anderen von der Princeton University und Google Research in dem Artikel „REACT: Synergieeffekte zwischen Denken und Handeln in SprachmodellenDie Studie schlägt ein allgemeines Paradigma vor, das Fortschritte in den Bereichen Denken und Handeln kombiniert, um Sprachmodellen die Lösung einer Vielzahl von Aufgaben des sprachlichen Denkens und der Entscheidungsfindung zu ermöglichen. Wir zeigen, dass das Reason+Act-Paradigma (ReAct) das Reason-and-Act-only-Paradigma sowohl bei der Steuerung eines größeren Sprachmodells als auch bei der Feinabstimmung eines kleineren Sprachmodells systematisch übertrifft. Die enge Integration von Denken und Handeln ermöglicht zudem eine mit dem Menschen konsistente Aufgabenlösungskurve und verbessert dadurch Interpretierbarkeit, Diagnostizierbarkeit und Steuerbarkeit.
ReAct ermöglicht es Sprachmodellen, verbale Argumentationsspuren und Textaktionen auf verschachtelte Weise zu generieren. Während Handlungen zu beobachtetem Feedback aus der äußeren Umgebung führen, wirken sich Denkprozesse nicht auf die äußere Umgebung aus. Stattdessen beeinflussen sie den internen Zustand des Modells, indem sie den Kontext analysieren und das Modell mit nützlichen Informationen aktualisieren, um zukünftige Überlegungen und Aktionen zu unterstützen.
ReAct ist ein einfacher, aber effektiver Ansatz zum Denken und Handeln in kollaborativen Sprachmodellen. Durch verschiedene Experimente mit Schwerpunkt auf Multi-Hop-Fragebeantwortung, Faktenprüfung und interaktiven Entscheidungsfindungsaufgaben zeigte das Forschungsteam, dass ReAct mit erklärbaren Entscheidungsspuren zu einer besseren Leistung führt.
ReAct demonstriert die Machbarkeit der gemeinsamen Modellierung von Gedanken, Aktionen und Umweltfeedback in einem Sprachmodell und macht es zu einem vielseitigen Agenten, der Aufgaben lösen kann, die eine Interaktion mit der Umwelt erfordern.