NVIDIAチームがKaggleでAGI指向の抽象推論競争を制す
NVIDIAの研究チームが、人工一般知能(AGI)の進展を測る重要な指標とされるKaggle「ARC Prize 2025」で優勝した。同チームは、NVIDIA Kaggle Grandmasters(KGMoN)のイヴァン・ソロキン氏とジャン=フランソワ・プージ氏から構成され、チーム名を「NVARC」として参戦。彼らはARC-AGI-2ベンチマークで29.72%のスコアを達成し、初期の公開リーダーボードでの27.64%を上回る成果を挙げた。特に注目すべきは、1タスクあたりたった20セントのコストで高い性能を実現した点。この成果は、巨大モデルに依存せず、効率的な設計で抽象的推論能力を発揮できることを示している。 ARC-AGI-2は、少数の例から抽象的なルールを学び、新しい問題に一般化する能力を測る難易度の高いベンチマーク。従来のパターン認識やデータの記憶に頼る手法では通用せず、真の「体系的抽象化」能力が問われる。そのため、このベンチマークのスコアは、AIが「ほぼ何も学ばずに」新しい課題を解く能力の指標として広く注目されている。 NVARCチームは、大規模言語モデルの連鎖的推論や強化学習エージェントといった従来のアプローチを採用せず、代わりに「合成データ生成」「テスト時学習」「厳格なエンジニアリング」の3本柱で戦略を構築。複数の段階でパズルを生成し、概念を分解するプロセスを用いて、多様なARCスタイルのデータセットを構築。最終モデルは、複雑なプログラム探索ではなく、パターンの認識と適応に特化した小型モデルとして設計された。 さらに、テスト時学習により、各問題のわずかな例からルールを即座に学習する仕組みを実現。これにより、計算リソースを効率的に使い、大規模モデルに比べて圧倒的に低コストで高い性能を発揮した。 この成果は、NVIDIAのNeMoツールキット(NeMo RL、NeMo Skillsなど)を活用して実現。合成データ生成パイプラインの自動化や、スケーラブルな強化学習の実装が、技術的基盤を支えた。 NVARCの成功は、AGIに近い推論能力の実現が、単なるモデルの巨大化ではなく、戦略的設計と効率的リソース活用によっても可能であることを示す画期的な証拠となった。
