中国科学機関がオープンソース化した第 2 世代スライド用 AI エージェント「DeepPresent」の評価スコアは GPT-5 に迫る
中国科学技術院ソフトウェア研究所のチームは最近、第 2 世代のスライドエージェントシステム「DeepPresenter」をオープンソース化しました。本システムはスライド生成モデルと完全なエージェントサンドボックス環境を一体化して公開し、単一の消費級 GPU と通常の端末でワンクリックデプロイをサポートするとともに、国内計算資源エコシステムとの互換性を確保し、AI を用いたプレゼンテーション資料作成の利用ハードルをさらに低下させました。機能設計において、DeepPresenter は Docker サンドボックス、arXiv のリアルタイム論文検索、および Python コード実行・データ可視化などの機能を統合した、20 種以上のツールを含む共有エージェント環境を構築することで、コンテンツ生成のプロフェッショナル性とデータの正確性の向上を図りました。同時に、「生成-レンダリング-検証-修正」というビジュアルクローズドループメカニズムを導入し、各ページのスライド生成後にスクリーンショットによるチェックと自動最適化を行い、レイアウトの適応調整を実現しています。訓練面では、チームは PersonaHub や arXiv などに基づく多様なタセットを構築し、独立審査機構を導入して生成結果に対する外部評価と誤り訂正を行いました。その結果、1152 のタスクから 802 の高品質データを抽出してモデル訓練に活用し、中国語・英語ならびに複数の複雑制約シナリオをカバーしました。テストにおいては、DeepPresenter(9B バージョン)が PPTEval ベンチマークで 4.19 点を記録し、GPT-5 の 4.22 点に近い性能を示すと共に、主要な複数方式を上回りました。分析によると、同システムは計算リソースコストと生成品質の間でより優れたバランスを実現しており、また編集可能な pptx ファイルの出力もサポートしているため、後続の変更や利用が容易です。
