HyperAI超神経

GTC 2025: チップだけではなく、ジェンセン・フアンは30分で物理AIにおけるいくつかの新しい成果をすべてオープンソースで発表しました。

特色图像

北京時間3月18日、AI業界のイベントに格上げされたNVIDIA GTC 2025が開幕したが、大ヒット製品の不足からか、  初日のオフラインフォーラムと展示会では、Nvidiaの株価の下落は反転しなかった。減少さえありました。そのため、ただでさえ注目の的となっている「基調講演」には、さらに注目と期待が寄せられました。

確かに、NVIDIA の株価の変動は、DeepSeek による「コンピューティング パワーの需要低下」の憶測に関連しているだけでなく、米国株式市場の調整によっても多かれ少なかれ影響を受けています。しかし、理由が何であれ、会社の舵取り役として、黄仁勲氏はできるだけ早く投資家の信頼を回復する必要がある。だからこそ、彼は約3時間に及ぶ演説の中で次のように語ったのです。

* スケーリングの法則は何度も言及されました。

* オープンソース運動に参加し、Llama モデル上に構築された NVIDIA Llama Nemotron 推論モデルをリリースします。

* 彼は、ブラックウェルが本格的に生産を開始したこと、「生産能力は驚くべきスピードで増加しており、顧客の需要も素晴らしい」と称賛した。

* 推論モデルの出現により、AI分野における「計算労力」が大幅に増加したことを明確に強調します。

*…

しかし、黄氏の熱のこもった演説はあまり効果がなかったようだ。記事執筆時点では、Nvidia の株価は依然として下落傾向にあります。

これはある意味、リークされたハードウェアとアーキテクチャのアップデートが市場からあまり好まれていないことを示している。ブラックウェル・ウルトラとヴェラ・ルービンに加えて、黄仁訓氏がこの30分間で共有した物理AIは、投資家や業界と深く共有するのに適したもう一つの「良い話」かもしれません。

ジェンセン・フアンがGTC 2025のリリースハイライトをまとめる

30 分で物理 AI の新たな成果が次々と発表される

2025年1月上旬に開幕したCES 2025において、NVIDIAは世界初となるベーシックモデルCosmosを公開した。黄仁訓氏は「AIの次のフロンティアは物理学だ」と叫んだ。これにより、物理 AI が一挙に AI のメインステージに押し上げられました。いわゆるフィジカル AI とは、ロボット、自動運転車、スマート スペースなどの自律システムが現実世界で複雑な操作を認識、理解、実行できるようにすることです。

3月19日の早朝、基調講演の最後に小型ロボット「ブルー」が登場すると、会場は歓声で最高潮に達した。両者の相互作用は、私たちにとって、Physical AI の概要を描き出すものでもあります。

写真

ステージ上のブルーと黄仁勲

黄仁訓は、この30分足らずの間に、一連の大ニュースを集中的に発表した。

1 つ目は、オープンソースの Physical AI データセットを起動することです。開発者に数千時間分のマルチカメラビデオ、ロボットトレーニング用の 320,000 以上の軌跡、最大 1,000 の一般的なシーンの説明 (OpenUSD) を含む 15 TB のデータを提供し、多様性、規模、地理的範囲に優れており、外れ値を識別してモデルの一般化パフォーマンスを評価できるため、セキュリティ研究の分野に特に役立ちます。 NVIDIA は、データセットは時間とともに拡大し続け、世界最大の統合オープンソース物理 AI データセットになる可能性があると公式に発表したことは特筆に値します。

* データセットのダウンロードアドレス:

https://go.hyper.ai/mkTKR

次は、世界初のオープンソースで完全にカスタマイズ可能なベースモデル、NVIDIA Isaac GR00T N1 です。人間の推論やその他のスキルを模倣するために使用されます。 GR00T N1 ベースモデルは、人間の認知原理に着想を得たデュアルシステム アーキテクチャを備えています。 「システム 1」は、人間の条件反射や直感を反映した、高速思考アクション モデルです。システム 2 は、思慮深く系統的な意思決定に使用される、ゆっくりとした思考モデルです。

3つ目は、ロボットシミュレーション用のオープンソース物理エンジンである Newton をリリースすることです。これは、NVIDIA CUDA-X アクセラレーション ライブラリ NVIDIA Warp をベースに、NVIDIA、Google DeepMind、Disney Research が共同で開発するもので、開発者に人工知能、ロボット工学、機械学習 (ML) をシミュレートするための GPU アクセラレーション カーネル プログラムを簡単に作成する方法を提供します。

最後に、Cosmos ワールド ベース モデルが更新され、オープン ソースで完全にカスタマイズ可能な推論モデルが導入されました。物理 AI 開発用に特別に設計されています。で、Cosmos Transferは合成データを生成するために使用され、セグメンテーション マップ、深度マップ、LIDAR スキャン、ポーズ推定マップ、軌跡マップなどの構造化されたビデオ入力を受け取り、制御可能なリアルなビデオ出力を生成します。 知的な世界生成のためのCosmos Predict、マルチフレーム生成がサポートされ、開始および終了の入力画像に基づいて中間アクションまたはモーション軌跡を予測します。 Cosmos Reason は、物理 AI データの注釈付けと整理の効率を向上させるために使用されます。既存のワールドベースのモデルを最適化したり、まったく新しいビジュアル言語アクション モデルを構築したりします。

加速コンピューティングから加速科学へ

NVIDIA は、Physical AI に加え、AI for Science の分野における展開をさらに深化させており、今後の新たな成長ポイントとなる可能性があります。

NVIDIA と AI for Science の関係は、おそらく、アクセラレーテッド コンピューティングとハイパフォーマンス コンピューティング (HPC) の強力な組み合わせから始まった CUDA の誕生にまで遡ることができます。黄仁訓はかつてこう言った。CUDA の開発以来、NVIDIA はコンピューティング コストを従来の 100 万分の 1 に削減しました。ある人にとって、NVIDIA は、最も小さなものを見ることができる計算顕微鏡であり、またある人にとっては、想像を絶するほど遠い銀河を探索できる望遠鏡であり、そして多くの人にとって、まだ時間があるうちに人生の仕事を追求できるタイムマシンなのです。」

つまり、CUDA と NVIDIA GPU のエコロジカルな組み合わせにより、並列コンピューティング機能が大幅に向上し、科学研究分野における高性能コンピューティングの応用が加速されたのです。今日、AI は科学研究業界に大きな勢いをもたらし、加速コンピューティングから加速科学への飛躍を達成しました。 NVIDIA は、この技術革新の嵐の中心に立っており、この機会を捉えるだけの先見性を持っているはずです。

先ほど終了した GTC 2025 基調講演で、黄仁勲氏は、開発者が CUDA-X と最新のスーパーチップ アーキテクチャを使用して、CPU と GPU リソース間のより緊密な自動統合と調整を実現できるようになり、従来の高速コンピューティング アーキテクチャを使用する場合と比較して、計算エンジニアリング ツールは 11 倍高速化し、計算能力は 5 倍になると発表しました。

黄氏は次のように結論づけた。CUDA-X はすでに、天文学、素粒子物理学、量子物理学、自動車、航空宇宙、半導体設計など、さまざまな新しいエンジニアリング分野に高速コンピューティングをもたらしています。

2018年のGTCカンファレンスでは、NVIDIA は、医療業界向けの初の AI プラットフォームである NVIDIA Clara を発表しました。同社は当初、医療画像処理分野に注力し、医療画像データ処理を加速する GPU ベースの AI ソリューションを提供しています。 2019 年、NVIDIA Clara はさらに拡張され、DNA/RNA 配列分析と高速遺伝子データ処理に使用される新しいゲノミクス コンピューティング プラットフォーム Clara Genomics が追加されました。

2019年末、NVIDIAは遺伝子シーケンシングソフトウェア開発会社であるParabricksを買収し、同社のGPUアクセラレーション遺伝子シーケンシングツールをNVIDIA Claraプラットフォームに統合しました。NVIDIAの公式文書によると、Parabricks は、10 分でヒトゲノム全体の 30 倍を分析できます。他の方法では30時間かかります。

2021年のGTCカンファレンスでは、NVIDIA は、医療機器専用のリアルタイム AI コンピューティング プラットフォーム Clara Holoscan を発表しました。目標は、医療機器にリアルタイムの AI コンピューティング機能を持たせ、医療画像分析、手術支援、遠隔医療の知能レベルを向上させることです。

2022年9月に開催されたGTCカンファレンスにおいて、NVIDIAはClaraをさらに拡張し、BioNeMoをリリースしました。当時、AI アクセラレーション コンピューティングから生成 AI まで、また初期の医療用画像 AI プラットフォームからより詳細なライフ サイエンス研究まで、NVIDIA の AI for Science の青写真はますます明確になっていきました。具体的には、BioNeMo は、超大規模な計算規模で大規模な生体分子言語モデルをトレーニングおよび展開するためのフレームワークです。事前トレーニング済みの言語モデルが 4 つ含まれています。

* タンパク質 LLM ESM-1: アミノ酸配列を処理し、さまざまなタンパク質の特性と機能を予測するために使用できる表現を生成し、科学者のタンパク質構造の理解能力を向上させます。 

* タンパク質モデリング ツール OpenFold のオープン ソース バージョン。
* 生成化学モデル MegaMolBART: 反応予測、分子最適化、新しい分子生成に使用できます。 

* ProtT5: ミュンヘン工科大学の RostLab が NVIDIA と共同で開発したもので、Meta AI の ESM-1b やその他のタンパク質 LLM の機能をシーケンス生成に拡張します。

医学・生命科学研究に加えて、NVIDIA は GTC 2024 で気候デジタルツイン クラウド プラットフォーム Earth-2 もリリースしました。新たにリリースされた生成 AI モデル CorrDiff を NVIDIA FourCastNet と組み合わせることで、1 キロメートル レベルで地球規模の気候シミュレーションを実現できます。

結論

各 GTC カンファレンスは、長い間、新製品や新技術の「プロモーション」から業界のベンチマークへとアップグレードされてきました。今年のカンファレンスでは、黄仁訓氏の次世代チップアーキテクチャと製品に対する期待が示されたほか、ロボット工学、自動運転、科学計算の分野での積極的な取り組みも見られました。後者が急速にNvidiaの主要な血液供給銀行に成長することを期待するのは明らかに時期尚早だが、現在の市場センチメントを急速に逆転させ、前者にとっての障害を取り除くことも非常に困難である。黄さんが今後どんな「奇策」を編み出すのか、楽しみに待とう。