Command Palette
Search for a command to run...
LLMs zum Planen befähigen: Logische Chain-of-Thought-Instruktionstuning für symbolische Planung
LLMs zum Planen befähigen: Logische Chain-of-Thought-Instruktionstuning für symbolische Planung
Pulkit Verma Ngoc La Anthony Favier Swaroop Mishra Julie A. Shah
Zusammenfassung
Große Sprachmodelle (LLMs) haben beeindruckende Fähigkeiten in einer Vielzahl von Aufgaben demonstriert, ihre Fähigkeit zur Durchführung strukturierter symbolischer Planung bleibt jedoch begrenzt, insbesondere in Domänen, die formale Darstellungen wie die Planning Domain Definition Language (PDDL) erfordern. In diesem Artikel präsentieren wir einen neuartigen Framework für Anweisungstuning, PDDL-Instruct, der darauf abzielt, die symbolische Planungsfähigkeiten von LLMs durch logisches Chain-of-Thought-Reasoning zu verbessern. Unser Ansatz konzentriert sich darauf, Modelle rigoros darin zu unterrichten, die Anwendbarkeit von Aktionen, Zustandsübergänge und Plan Gültigkeit mithilfe expliziter logischer Schlussfolgerungsschritte zu analysieren. Durch die Entwicklung von Anweisungsprompts, die Modelle Schritt für Schritt durch die präzise logische Argumentation führen, die erforderlich ist, um festzustellen, wann Aktionen in einem gegebenen Zustand angewendet werden können, ermöglichen wir es LLMs, ihren Planungsprozess durch strukturierte Reflexion selbst zu korrigieren. Der Framework baut Verifizierungsfähigkeiten systematisch auf, indem er den Planungsprozess in explizite Schlussketten zur Überprüfung von Voraussetzungsbedingungen, Effektanwendung und Invarianzerhaltung zerlegt. Experimentelle Ergebnisse auf mehreren Planungsdomänen zeigen, dass unsere auf Chain-of-Thought-Reasoning basierenden, an Anweisungen angepassten Modelle deutlich bessere Planungsergebnisse erzielen und eine Planungsgenauigkeit von bis zu 94 % auf Standardbenchmarks erreichen – eine absolute Verbesserung um 66 % gegenüber Basismodellen. Diese Arbeit schließt die Lücke zwischen den allgemeinen Schlussfolgerungsfähigkeiten von LLMs und der logischen Präzision, die für automatisierte Planung erforderlich ist, und eröffnet einen vielversprechenden Ansatz für die Entwicklung fortschrittlicherer KI-Planungssysteme.