HyperAIHyperAI

Command Palette

Search for a command to run...

vor 18 Tagen
Generative KI
LLM

Das von der Chinesischen Akademie der Wissenschaften entwickelte Open-Source-PowerPoint-Agentensystem zweiter Generation DeepPresenter erzielt in Tests eine Punktzahl nahe an GPT-5.

Das Team des Instituts für Software der Chinesischen Akademie der Wissenschaften hat kürzlich das zweite Generation intelligente Agentensystem DeepPresenter als Open Source veröffentlicht. Dieses System integriert ein Folien-Generierungsmodell mit einer vollständigen intelligenten Sandbox-Umgebung und ermöglicht die Bereitstellung auf einem einzigen Consumer-Grafikchip sowie an herkömmlichen Endgeräten per Knopfdruck. Es ist zudem kompatibel zur lokalen Rechenleistungsökosystem, was die Einstiegshürden für den Einsatz von KI-generierten Präsentationen weiter senkt. Im Hinblick auf das Funktionsdesign bietet DeepPresenter eine geteilte Agentenumgebung mit über 20 verschiedenen Werkzeugen, darunter Docker-Sandbox, Echtzeit-Literaturrecherche via arXiv sowie Python-Codeausführung und Datenvisualisierung, um die Professionalität der Inhaltsgenerierung und die Datengenauigkeit zu steigern. Gleichzeitig führt das System einen visuellen Regelkreis „Erzeugen – Rendern – Prüfen – Korrigieren" ein, der nach dem Generieren jeder einzelnen Folie eine Screenshot-Kontrolle und automatische Optimierung durchführt, wodurch eine adaptive Anpassung des Layouts realisiert wird. Beim Training baute das Team auf Basis von PersonaHub und arXiv diverse Aufgabensets auf und führte einen separaten Bewertungsmechanismus ein, um externe Evaluierungen und Fehlerkorrekturen der generierten Ergebnisse vorzunehmen. Aus insgesamt 1152 Aufgaben wurden schließlich 802 hochwertige Datensätze für das Modelltraining ausgewählt, welche Szenarien in chinesischer und englischer Sprache sowie verschiedene komplexe Einschränkungen abdecken. In Tests erreichte DeepPresenter (Version 9B) beim PPTEval-Evaluationssystem eine Punktzahl von 4,19, nahe am Wert von GPT-5 mit 4,22 Punkten, und übertroffen dabei mehrere gängige Lösungen. Analysen zeigen, dass dieses System eine optimale Balance zwischen Rechenaufwand und Generationsqualität erzielt und gleichzeitig bearbeitbare pptx-Dateien ausgeben kann, was spätere Änderungen und Nutzung erleichtert.

Verwandte Links

Das von der Chinesischen Akademie der Wissenschaften entwickelte Open-Source-PowerPoint-Agentensystem zweiter Generation DeepPresenter erzielt in Tests eine Punktzahl nahe an GPT-5. | Aktuelle Beiträge | HyperAI