ChatGPTエージェント、コンピュータ全域の制御とタスク実行を希望
ChatGPT Agent: チャットボットを超えた新たなマルチステップタスクツール OpenAIが新たな人工知能モデル「ChatGPT Agent」を導入し、チャットボットの制限を超えてユーザーの装置全体で多様なタスクをこなすことが可能になりました。ChatGPT Agentは、リクエストを受け取り、ウェブブラウザを操作したりアプリを開いたりして、タスクを完了します。具体的には、カレンダーを確認して将来のクライアントミーティングの概要を報告したり、家族向けの朝食の材料を買い揃えたり、競合他社の分析を行いプレゼンテーション資料を作成するといった用途があります。この新しいモデルは、OperatorとDeep Researchの機能を組み合わせたもので、複雑なタスクにも対応しています。Operatorはウェブブラウザを操作する能力を有し、Deep Researchはマルチステップの研究や分析を行える機能を持つツールです。 ChatGPT Agentの初期印象は混合しているものの、その能力は注目に値します。しかし、Wiredはその速度について指摘しており、1時間近くかかる場合もあるとのこと。それでもIsa Fulford氏は、「自分でしなくて済むので時間を節約できる」と述べています。特に印象的なのは「リプレイ」機能で、ユーザーはAIがタスクを完成させるまでの過程を見ることができます。 OpenAIは、新モデルの開発と導入に20〜35人のプロダクトチームと研究チームのメンバーを結集させました。同社は、ChatGPT Agentが「仮想コンピューター」を使用していることで、ツールセットが大幅に拡張されたと説明しています。ただし、Emailの送信や予約などの不可逆な行動を行う前には必ずユーザーの許可が必要です。 ChatGPT AgentはPro、Plus、およびTeamプランのユーザーに対して最初に提供され、その後ChatGPT EnterpriseとEducationユーザーにも夏末までに展開される予定です。ヨーロッパ経済圏やスイスへの展開スケジュールは未定です。 AIエージェントの業界トレンド 「AIエージェント」という概念は、業界において長年話題になっていましたが、2023年に投資家や技術経営者が注目し始め、急速に流行しました。Klarnaは2024年2月に自身のAIエージェントを導入し、1ヶ月での運用により顧客サービスチャットの3分の2を処理できたことを発表しました。これにより、Amazon、Meta、Googleなど大手企業のCEOらが自社のAIエージェント戦略について定期的に言及するようになりました。その後、AI関連企業では戦略的に人材を獲得し、これらの目標達成に向けて動き始めています。例えば、Googleは先週WindsurfのCEOやR&Dチームを採用し、エージェンシーAIプロジェクトをさらに進める方針を示しました。 OpenAIのChatGPT Agentのリリースは、Operatorのリリースに続くものであり、AIエージェントのより大きなトレンドの一環でもあります。Anthropicも昨年10月に同様のツール「Computer Use」をリリースしています。多くのAI企業が、消費者の注目を集め、習慣化につながるAIエージェントを目指しています。 背景の補足: AIエージェントの意義と影響 AIエージェントは、単に会話を通じて情報提供を行うだけでなく、具体的な業務を自動で処理できることから、労働力の効率化や生産性の向上に期待が寄せられています。しかし、これらのツールが人間の仕事を完全に置き換えるかについては議論があり、Klarnaの事例では品質問題から再び人間オペレーターに切り替えられたことが分かります。OpenAIのような先駆的な企業が、安全性と有効性の両面を兼ね備えたAIエージェントの開発に尽力することで、業界全体の進歩が加速すると見られています。