HyperAIHyperAI

Command Palette

Search for a command to run...

SheetCopilot: Die Software-Produktivität auf ein neues Niveau durch große Sprachmodelle bringen

Hongxin Li*1,2, Jingran Su*3,4, Yuntao Chen†3, Qing Li†4, and Zhaoxiang Zhang†1,2,3,5

Zusammenfassung

Computernutzer haben Milliarden von Stunden damit verbracht, tägliche Aufgaben wie die Verarbeitung tabellarischer Daten und das Erstellen von Projektzeitplänen zu erledigen. Die meisten dieser Aufgaben sind wiederholend und fehleranfällig, dennoch fehlen den meisten Nutzern die Fähigkeiten, diese belastenden Arbeiten zu automatisieren. Mit der Einführung großer Sprachmodelle (LLMs) wird es möglich, Software mittels natürlicher Sprache zu steuern. In dieser Arbeit schlagen wir einen SheetCopilot-Agenten vor, der natürlichsprachliche Aufgaben entgegennimmt und Tabellenkalkulationssoftware steuert, um die Anforderungen zu erfüllen. Wir definieren eine Reihe atomarer Aktionen als Abstraktion der Funktionalitäten von Tabellenkalkulationssoftware. Weiterhin entwickeln wir ein auf Zustandsautomaten basierendes Task-Planungsframework, um eine robuste Interaktion zwischen LLMs und Tabellenkalkulationen zu ermöglichen. Wir haben einen repräsentativen Datensatz mit 221 Tabellensteuerungsaufgaben zusammengestellt und einen vollständig automatisierten Evaluationsprozess eingerichtet, um die Leistungsfähigkeit von LLMs bei Softwaresteuerungsaufgaben streng zu bewerten. Unser SheetCopilot führt 44,3 % der Aufgaben bei einer einzelnen Generierung korrekt aus und übertrifft dabei den starken Codegenerierungs-Baseline deutlich. Unsere Projektseite: https://sheetcopilot.github.io/.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
SheetCopilot: Die Software-Produktivität auf ein neues Niveau durch große Sprachmodelle bringen | Paper | HyperAI