o3-Pro、待つ価値はあるのか? $200/月のサブスクで超計算力モデルの実力を検証
o3 Proの導入とその評価 OpenAIが新たに導入したo3 Proは、特定の問題に対して大幅に計算資源を投入できるモデルです。月額200ドルのChatGPT Proサブスクリプション料金を支払っている場合や、APIで使用する際に従来のo3より高い費用を払う価値があるかについての議論が続いています。 o3 Proの主な特徴は、計算時間を大幅に増やして問題に取り組むことです。そのため、回答はo3より正確で深い洞察を得ることができます。しかし、この長時間の計算はワークフローを妨げるもので、15分以上待つ必要が frequent となります。結果として、多くのユーザーはo3 Proを使用することに対して二の脚を踏んでおり、過度の待ち時間に対するストレスが指摘されています。 主要な意見と評価 Sam AltmanやGreg Brockman(OpenAI)は、o3 Proがo3よりも明らかに優れていると述べています。専門家のレビューでは、o3 Proは科学、教育、プログラミング、データ分析、そして執筆において大幅に改善されていることが示されました。 Tyler Cowenは、o3 Proが他のモデルよりも少ない幻覚化(hallucinations)を伴うと非常に強く支持しています。彼は、経済学の問題解決にo3 Proが優れていると報告しています。 Matt Shumerは、o3 Proが日常的なコーディングモデルとして適していないが、大量のデータを処理して深い洞察を得るのに非常に効果的だと指摘しています。 Dominik LukesやKostya Medvedovskyは、o3 Proが特に技術的なタスクや長期的な分析に有用である一方、シンプルな問題には過剰に時間を使う傾向があると評価しています。 Chrisは、o3 Proの小説作成能力が驚くほど優れているとの印象を共有しています。一方、Juliusは、Essaysの編集に時間がかかり、結果も平均的なものになると批判しています。 業界関係者のコメント McKay Wrigleyは、o3 Proが複雑な問題に対する一発目の解答で印象的だと述べていますが、日常的な使用には遅すぎて適していないと指摘しています。 Clayは、o3 Proが大量の計算時間をかけて問題に取り組むことで「ブレークスルー」を達成していると評価しますが、コストと速度の観点から、「クラウド・ソネット」のような他のモデルがより有用である可能性があると述べています。 Aaron Levieは、AIの推論コストが急速に低下していることを強調し、将来的に経済的に viable となるような高度な機能を持つAIエージェントの開発に力を注ぐべきだと論じています。 Jerry Liuは、o3 Proの回答が非常にコンパクトで時間浪費がないと評価し、Deep Researchクエリより効率的だと指摘しています。 o3 Proの存在意義は、特定の高度な問題に対処するためのツールとして認められていますが、コストの高さと速度の遅さが普及のハードルとなっています。一部の専門家や技術者は、o3 Proが既存のo3や他のモデルよりも優れていると考えていますが、多くのユーザーはそれを日常的なデフォルトのモデルとして採用することは難しいと感じています。 会社概要および補足情報 OpenAIは、o3 Proがo3と同じ基本モデルを使用しているため、o3のシステムカードに詳しい安全性情報があると説明しています。ただし、Miles Brundageは、o3 Proが新たな評価対象であってもシステムカードが更新されていないことは問題だと指摘しています。o3 Proは、特定のニッチな場面での使用向けに設計されたモデルであり、その性能は一定の条件下で大きな飞跃をもたらしますが、一貫性のある評価手法の欠如は懸念材料となる可能性があります。