HyperAIHyperAI

Command Palette

Search for a command to run...

NVIDIA、合成世界生成モデル「Cosmos 2.5」で物理AI開発を加速

NVIDIAが発表した「NVIDIA Cosmos」オープンワールド基礎モデル(WFMs)の最新アップデートにより、物理AI(ロボットや自動運転車など)の開発に必要な合成データ生成が飛躍的に進化した。物理AIはリアルタイムでの認識・判断・動作が求められ、実世界の多様な状況に普遍的に対応できる必要があるが、そのデータ収集はコストが高く、時には危険な場合もある。これに対し、物理ベースの合成データ生成が効果的な解決策として注目されている。 最新版のCosmos Predict 2.5は、テキスト・画像・動画から一括して一貫性のあるマルチカメラ映像世界を生成する統合型軽量アーキテクチャ。また、Cosmos Transfer 2.5は、天候や照明、地形をリアルタイムで変更可能な高精細なスタイル転送機能を備え、前バージョンより3.5倍小さく、速度と物理的正確性が向上。これらのモデルは、NVIDIA Omniverseプラットフォーム上に構築されたオープンソースロボティクスシミュレーター「Isaac Sim」に統合され、写実的な動画データを大量生成可能。 Skild AIやServe Roboticsといった企業が、これらの技術を活用して実世界のデータ収集の限界を補っている。Serve Roboticsは、100万マイル以上のリアルデータと数千のシミュレーションを組み合わせ、都市部での配達ロボットの実運用を実現。同社はさらに、NVIDIA DGX Spark超コンピューターをロボットで配送するなど、AIハードウェアのデリバリーにも応用している。ZiplineもドローンによるDGX Sparkの配送を実施。 また、LightwheelやFS Studio、Robots for Humanityといった企業が、合成データでオブジェクト検出精度を向上。矿山業では、合成画像で岩塊検出システムを強化し、年間最大65万ドルの損失を回避。物流業界では、異なる照明条件のパッケージ画像を大量生成し、誤検出を大幅に削減。 NVIDIAは、OpenUSDを基盤にした合成データパイプラインの構築を推進。開発者はOmniverseやBlenderを活用し、実世界に近いシミュレーション環境を構築し、物理AIの信頼性と実用性を高めている。この技術は、AIの安全な実装と、リアルな世界とのギャップの解消に貢献している。

関連リンク