2025年、AIの年:推論・エージェント・中国勢の台頭とコード生成の進化
2025年は大規模言語モデル(LLM)の進化が目覚ましい年だった。特に「推論力(reasoning)」の向上が大きな転換点となった。OpenAIが2024年9月に発表したo1シリーズを皮切りに、2025年初頭にo3やo4-miniを発表し、リーダー的地位を確立。この「推論スケーリング」は、自動検証可能な報酬に基づく強化学習(RLVR)によって、モデルが問題を段階的に分解し、誤りを修正しながら解く能力を獲得する仕組み。これにより、数学やコードの論理的推論が飛躍的に向上。特にGPT-5やClaude Opus 4.5は、人間が数時間かかるタスクをAIが独立して完了するまでに進化した。 この推論力の進化がもたらした最大の成果は「エージェント」の実用化だった。特に2月にAnthropicが静かにリリースした「Claude Code」は、コード生成・実行・結果の検証・再試行を自動で繰り返す「コードエージェント」の代表例。これにより、開発者は「async coding agent」としてタスクを投げかけ、数分後にPull Requestを受領するという新しい開発スタイルが定着。OpenAIのCodex Web、GoogleのJules、GitHub Copilot CLIなども同様の機能を提供。これにより、開発の生産性が飛躍的に向上し、特に複雑なバグの診断や大規模コードベースの変更が可能になった。 2025年は「CLI(コマンドライン)でのLLM活用」の年でもあった。Claude CodeやCodex CLIが登場し、開発者がターミナルからAIにタスクを投げかけることで、セキュリティリスクを抑えつつ効率的な作業が可能に。特にアシンクロナスなエージェントは、個人PCに直接コードを実行させないため、安全に「YOLOモード」(確認なし実行)で運用可能。これにより、開発者は複数のタスクをスマホから同時発行し、結果を待つという「並列開発ライフスタイル」が普及。 中国のAIラボも飛躍的進展を見せ、DeepSeek R1やGLM-4.7、Kimi K2 Thinking、MiniMax-M2.1などがトップクラスの性能を発揮。特にDeepSeek R1のリリースは、NVIDIAの時価総額が6000億ドル急落するなど、世界経済に影響を与える出来事となった。中国モデルはオープンソースで、Apache 2.0やMITライセンスを採用し、研究の進展を後押ししている。 画像生成分野では、OpenAIの「gpt-image-1」が3月にリリースされ、ユーザーがアップロードした画像にプロンプトで編集を加える機能が爆発的普及。1週間で1億人の新規登録を記録。Googleの「Nano Banana」モデルは、テキストを含む詳細なインフォグラフィックを生成可能で、プロフェッショナル用途でも活用されるようになった。 また、AIが国際数学オリンピックや大学プログラミングコンテストで金メダルを獲得するなど、学術的実力の証明も進んだ。一方、Llama 4は期待に応えず、Metaの開発戦略の不透明さが指摘された。OpenAIも、Google Geminiの台頭により、リーダー地位を脅かされる状況に。 2025年は、AIの「信頼性・安全性・倫理」の議論が本格化した年でもあった。Anthropicの「スニッチ(snitch)」機能、Googleの「レーザー・トリフェクタ( lethal trifecta)」というプロンプトインジェクションの危険性の定義、そして「slop(低品質AI生成コンテンツ)」がメリー・ウェブスターの「2025年語」に選ばれるなど、社会的影響が広がった。また、データセンターの環境負荷への反発が高まり、200以上の環境団体が米国の新設工事に反対する声を上げた。 2025年は、AIが「実用的・生産的・社会的」な存在として、本格的に社会に根付いた年と言える。
