HyperAIHyperAI
vor 2 Monaten

SheetCopilot: Die Software-Produktivität auf ein neues Niveau durch große Sprachmodelle bringen

Hongxin Li; Jingran Su; Yuntao Chen; Qing Li; Zhaoxiang Zhang
SheetCopilot: Die Software-Produktivität auf ein neues Niveau durch große Sprachmodelle bringen
Abstract

Computernutzer haben Milliarden von Stunden damit verbracht, tägliche Aufgaben wie die Verarbeitung tabellarischer Daten und das Erstellen von Projektzeitplänen zu erledigen. Die meisten dieser Aufgaben sind wiederholend und fehleranfällig, dennoch fehlen den meisten Nutzern die Fähigkeiten, diese belastenden Arbeiten zu automatisieren. Mit der Einführung großer Sprachmodelle (LLMs) wird es möglich, Software mittels natürlicher Sprache zu steuern. In dieser Arbeit schlagen wir einen SheetCopilot-Agenten vor, der natürlichsprachliche Aufgaben entgegennimmt und Tabellenkalkulationssoftware steuert, um die Anforderungen zu erfüllen. Wir definieren eine Reihe atomarer Aktionen als Abstraktion der Funktionalitäten von Tabellenkalkulationssoftware. Weiterhin entwickeln wir ein auf Zustandsautomaten basierendes Task-Planungsframework, um eine robuste Interaktion zwischen LLMs und Tabellenkalkulationen zu ermöglichen. Wir haben einen repräsentativen Datensatz mit 221 Tabellensteuerungsaufgaben zusammengestellt und einen vollständig automatisierten Evaluationsprozess eingerichtet, um die Leistungsfähigkeit von LLMs bei Softwaresteuerungsaufgaben streng zu bewerten. Unser SheetCopilot führt 44,3 % der Aufgaben bei einer einzelnen Generierung korrekt aus und übertrifft dabei den starken Codegenerierungs-Baseline deutlich. Unsere Projektseite: https://sheetcopilot.github.io/.