SheetAgent: Ein allgemeiner Agent für die Analyse und Manipulation von Tabellenkalkulationen durch große Sprachmodelle

Tabellenkalkulationsblätter sind im World Wide Web weit verbreitet und spielen eine entscheidende Rolle bei der Steigerung der Arbeitswirkungsgrade in verschiedenen Bereichen. Kürzlich wurde versucht, große Sprachmodelle (LLMs) für die automatische Bearbeitung von Tabellenkalkulationsblättern einzusetzen, jedoch wurden sie noch nicht in komplexen und realistischen Aufgaben untersucht, bei denen Herausforderungen des Denkprozesses bestehen (z.B. langfristige Bearbeitung mit mehrstufigem Denken und unklaren Anforderungen). Um die Lücke zwischen den realen Anforderungen zu schließen, stellen wir SheetRM vor, einen Benchmark, der langfristige und mehrkategorische Aufgaben mit den auf reale Lebensbedingungen basierenden Herausforderungen des Denkprozesses umfasst. Um die genannten Herausforderungen zu mindern, schlagen wir zudem SheetAgent vor, ein neuartiges autonomes Agentenmodell, das die Leistungsfähigkeit von LLMs nutzt. SheetAgent besteht aus drei kollaborativen Modulen: Planer, Informator und Retriever. Diese erreichen sowohl fortschrittliches Denken als auch präzise Bearbeitung von Tabellenkalkulationsblättern ohne menschliche Intervention durch iteratives Aufgaben-Denken und Reflexion. Ausführliche Experimente zeigen, dass SheetAgent eine Verbesserung der Durchlaufquote von 20--40 % auf mehreren Benchmarks gegenüber Baseline-Methoden erzielt und so eine gesteigerte Präzision bei der Bearbeitung von Tabellenkalkulationsblättern sowie überlegene Tabellen-Denkfähigkeiten demonstriert. Weitere Details und Visualisierungen sind auf der Projektwebsite verfügbar: https://sheetagent.github.io/. Die Datensätze und Quellcode können unter https://anonymous.4open.science/r/SheetAgent abgerufen werden.