HyperAI超神経
Back to Headlines

OpenAIのChatGPT Agent、複雑なタスクをこなす新AIアシスタントの実力と限界

9時間前

OpenAIが新たに発表したChatGPT Agentは、複雑かつ多段階のタスクをユーザーに代わって「仮想コンピュータ」上で実行可能なAIツールです。このツールは、既存のOperatorとDeep Researchの機能を組み合わせたもので、1ヶ月間のProプランへの登録費用が必要です。デビュー後わずか1日で、すでにChatGPT Agentの性能に関して評価が分かれています。 最初に試したタスクは、Etsyで日本風のヴィンテージスタイルのランプを200ドル以下で見つけ、カートに追加することでした。詳細な指示を入力すると、ChatGPT Agentは50分間かかって5つの選択肢を提供しました。しかし、代理でカートに追加したと報告したものの、実際には私のEtsyアカウントのカートには何も入りませんでした。Agentは自己の仮想PCを操作するため、ログイン情報にアクセスできず、ユーザーにURLを共有することで対処しています。 次に、ChatGPT Agentがどのように金融取引を扱うかを検証しました。結果として、自動的な口座間の移動など、セキュリティ上敏感な操作は制限されています。OpenAIの製品担当者は、これらの操作が「現時点では」許可されておらず、Watch Modeを介したユーザーの監視が必要であると述べました。 さらに、コロラド州に住む友人向けの花の注文を依頼しました。Agentは、信頼性のある送り先を提案し、予算内での最大限の選択肢を提供しました。ただし、具体的な購入や送付の手続きは直接行うことができません。代わりに、ユーザー自身が操作を行う手順案内を提供します。例えば、「Vintage Magnolia」という地元のフラワーショップについての情報を提供し、具体的なブーケの選択をサポートしました。しかし、最終的な注文はユーザー自身が行わなければなりません。 ChatGPT Agentの特徴は、データの収集や比較、分析、文書作成など、面倒なタスクを大幅に軽減できることですが、実際の取引執行には未だに課題があります。これは、Agentがユーザーの実際のブラウザやログイン情報を使用できないことによるものです。そのため、より複雑なオンラインショッピングや具体的な操作ができないため、期待されていたほど便利ではありません。 ChatGPT Agentは、AI-Agentの領域での一歩前進ではありますが、実世界での有用性を最大限に引き出すには、まだ改善の余地があることが明らかになりました。OpenAIのチームは難易度の高いタスクに焦点を当て、実行速度よりも品質の最適化を重視していると述べています。 業界関係者のYash KumarとIsa Fulfordによると、現在のChatGPT Agentは背景で動作し、ユーザーが他の作業を続けることを想定しています。それでも、金融取引や一部のオンラインショッピングについては、セキュリティ上の理由から直接操作を避けており、ユーザーに対するサポートに留まっています。OpenAIは今後、Agentの機能と信頼性をさらに向上させる計画を持っています。

Related Links