オンライン チュートリアル | 物理 AI システムのイノベーション、太陽光と霧をシミュレートできる NVIDIA の世界基本モデルをすぐに始めましょう

1月初旬のCES 2025カンファレンスで、Huang Renxunは新しいレザージャケットを着用し、「世界最速のGPU RTX 5090」に加えて、世界のベーシックモデルCosmosも広く注目を集めました。
「AI の次のフロンティアは物理学です。」ファン氏は Cosmos を使用して、このトレンドの研究と判断の起源と信頼性を直感的に説明しました。
名前が示すように、ワールド モデルは仮想世界を生成およびシミュレートして、シーン内のオブジェクトの空間関係とそれらの物理的な相互作用をシミュレートできます。具体的には、Cosmos ワールド基本モデルは、物理知覚ビデオ生成のための開放拡散および自己回帰トランスフォーマー モデルのセットです。9,000兆個のトークンは、2,000万時間にわたる現実世界の人間の相互作用、環境、産業、ロボット、運転のデータに基づいてトレーニングされています。

Nvidia のシニアサイエンティストである Jim Fan がソーシャル アカウントで Cosmos について正確に要約しています。
* 2 つのモードを提供します:拡散モード (連続マーカー) と自己回帰モード (離散マーカー)。
* 2 つの生成方法をサポートします:
テキストはビデオを生成し (テキスト -> ビデオ)、テキスト + ビデオはビデオを生成します (テキスト + ビデオ -> ビデオ)

この革新的な世界基本モデルを誰でも簡単に体験できるように、HyperAI Super Neural 公式 Web サイトのチュートリアル セクションで「Cosmos 世界基本モデルのワンクリック展開」を開始しました。興味のある方は、ぜひ試してみてください。
チュートリアルのアドレス:
デモの実行
1. hyper.ai にログインし、「チュートリアル」ページで「Cosmos ワールド基本モデルのワンクリック展開」を選択し、「このチュートリアルをオンラインで実行する」をクリックします。


2. ページがジャンプしたら、右上隅の「クローン」をクリックしてチュートリアルを独自のコンテナにクローンします。

3. 「NVIDIA RTX A6000」のコンピューティングパワーと「PyTorch」イメージを選択します。必要に応じて「従量課金制」または「毎日/毎週/毎月」を選択し、最後に「続行」をクリックします。
以下の招待リンクを使用してサインアップした新規ユーザーは、4 時間の RTX 4090 + 5 時間の CPU を無料で入手できます。
HyperAI ハイパーニューラルの専用招待リンク (ブラウザに直接コピーして開きます):
https://openbayes.com/console/signup?r=Ada0322_QZy7
さらに、OpenBayes 新年イベントが進行中です。シングル カード RTX 4090 および RTX A6000 パッケージが日/週あたり半額で入手できます。

4. リソースが割り当てられるまで待ちます。最初のクローンには約 7 分かかります。ステータスが「実行中」に変わったら、「ワークスペースを開く」をクリックし、「ターミナル」を開きます。


5. 次のコマンドを入力して環境をアクティブ化します。
conda activate ./cosmos

6. 次のコマンドを入力して、Cosmos ディレクトリを切り替えます。
cd Cosmos

7. 次のコマンドを入力して、モデル勾配インターフェイスを開始します。
PYTHONPATH=$(pwd) python cosmos1/models/diffusion/inference/gradio_text2world.py --checkpoint_dir checkpoints --diffusion_transformer_dir Cosmos-1.0-Diffusion-7B-Text2World --offload_prompt_upsampler --offload_text_encoder_model --offload_guardrail_models --video_save_name Cosmos-1.0-Diffusion-7B-Text2World --checkpoint_dir /input0
ポート 8080 が表示されたら、右側の API アドレスを開いてグラデーション インターフェイスにアクセスします。

エフェクト表示
1. グラデーションインターフェイスに入ったら、「プロンプトを入力してください」にプロンプトの単語を入力し、「送信」をクリックして推論を実行します。数分後に、生成されたビデオが表示されます。
編集者は自然なシーンのビデオを生成しました。参考のためにプロンプトを以下に示します。
プロンプト: ある早朝、山の雲の間から太陽が輝き、静かな湖を照らしました。湖は透明で、緑の森に囲まれています。遠くの山々は霧に覆われ、数羽の鳥が空を飛び、空気は新鮮で、静かで平和です。
私たちは「安定拡散チュートリアル交換グループ」を設立し、さまざまな技術的問題について話し合ったり、アプリケーションの効果を共有したりするためにグループに参加する友人を歓迎します~
以下の QR コードをスキャンして Neurostar WeChat (WeChat ID: Hyperai01) を追加し、「SD チュートリアル交換グループ」とコメントしてグループ チャットに参加します。

