HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 18 jours
IA Générative
LLM

Le système d'agent intelligent pour diapositives DeepPresenter de deuxième génération à code ouvert de l'Académie chinoise des sciences obtient un score d'évaluation proche du GPT-5.

L'équipe de l'Institut d'informatique de l'Académie chinoise des sciences a récemment ouvert en tant que logiciel libre le système d'agent intelligent pour diapositives DeepPresenter de deuxième génération. Ce système intègre et rend accessible un modèle de génération de diapositives avec un environnement sandbox complet dédié aux agents, permettant un déploiement en un clic sur une seule carte graphique grand public ou un terminal standard, tout en étant compatible avec l'écosystème local de puissance de calcul, réduisant ainsi davantage les barrières à l'utilisation de la production de présentations par IA. En termes de conception fonctionnelle, DeepPresenter met en place un environnement partagé d'agents intégrant plus de 20 outils, incluant Docker Sandbox, la recherche documentaire en temps réel via arXiv, ainsi que l'exécution du langage Python et la visualisation des données afin d'améliorer la professionnalisme du contenu généré et sa précision factuelle. Parallèlement, le système introduit un mécanisme de boucle visuelle « Génération – Rendu – Examen – Correction », qui réalise des vérifications par capture d'écran et une optimisation automatique après la création de chaque diapositive, assurant ainsi un ajustement adaptatif de la mise en page. Concernant l'entraînement, l'équipe a constitué un ensemble diversifié de tâches basé sur des données provenant notamment de PersonaHub et d'arXiv, et a intégré un mécanisme d'évaluation indépendant pour soumettre les résultats générés à une évaluation externe et à une correction d'erreurs. Au final, parmi les 1152 tâches initiales, 802 lignes de données de haute qualité ont été sélectionnées pour l'entraînement du modèle, couvrant des scénarios complexes dans les langues chinoise et anglaise ainsi qu'environnements multi-constraints variés. Dans les tests effectués, DeepPresenter (version 9B) a obtenu une note de 4,19 lors de l'évaluation PPTEval, se rapprochant fortement des performances de GPT‑5 affichées à 4,22 points, surpassant plusieurs solutions dominantes. Les analyses indiquent que ce système atteint un équilibre optimal entre coût computationnel et qualité de génération ; il permet également de produire des fichiers pptx modifiables, facilitant leur modification ultérieure et leur utilisation pratique.

Liens associés

Le système d'agent intelligent pour diapositives DeepPresenter de deuxième génération à code ouvert de l'Académie chinoise des sciences obtient un score d'évaluation proche du GPT-5. | Articles tendance | HyperAI