HyperAIHyperAI

Command Palette

Search for a command to run...

オデッセイが新AIモデルで3Dインタラクティブワールドを実現、ピクサー共同創業者が支援

主な要約 AIベンチャー企業Odysseyは、ユーザーがストリーミング映像と「対話」できる新しいAIモデルを開発した。この技術はウェブ上で早期デモとして利用可能で、40ミリ秒ごとにビデオフレームを生成し、ストリーミングすることができる。基本的な操作を使用することで、ユーザーはビデオ内のエリアを探検できる。モデルは、現在の状況、ユーザーの行動、そして歴史的な状況と行動データを基に、次の状態を予測しようとする。これは新しい世界モデルを使用しており、リアルなピクセルの生成、空間の一貫性の維持、行動の学習、および最大5分以上の一貫したビデオストリームの出力といった機能を備えている。 Odysseyのデモはまだ未完成の部分がある。「現実世界の探索のような不完全な夢の中にいるような印象」を与え、画像はぼやけて歪んでいる場合がある。進行方向や方向転換によっては、周囲の環境が突然異なるものに変わり、不安定性があります。しかし、会社はこの技術の高速な向上を約束しており、現在ではNvidia H100 GPUのクラスターを使用して1から2ドルの料金で1時間当たりのユーザ利用が可能だ。 Odysseyは、360度のバックパックカメラシステムを設計し、現実世界のランドスケープを収集することで、より高品質なモデルを作成している。このアプローチにより、公開データだけで学習されたモデルよりも質の高いシミュレーションが可能になると考えている。現時点で、OdysseyはEQT Ventures、GV、Air Street Capitalなどから2700万ドルの資金調達を行い、ピクサーの共同設立者であるEd Catmullもボドー・オブ・ディレクターズにはいる。 多くのスタートアップや大手テクノロジー企業が世界モデルの研究に取り組んでいる。DeepMind、AI研究者のFei-Fei Liが率いるWorld Labs、Microsoft、Decartなどが同様の技術を開発中だ。彼らは、この技術が将来的には_interactive media_(インタラクティブメディア)、例えばゲームや映画の制作やリアルタイムシミュレーションの訓練場所として使用できると考えている。 しかし、クリエイティブ業界ではAIへの反応は複雑だ。_Wired_の最近の調査によると、Activision BlizzardなどのゲームスタジオはAIを使用して効率化を図る一方で、労働力を削減しており、2024年のAnimation Guildの調査では、AIにより今後数か月で10万人以上の米国のフィルム、テレビ、アニメーションの職が影響を受ける可能性があるとする。Odysseyはクリエイティブプロフェッショナルたちと協力し、彼らを代替するのではなく補完することを目指している。 Odysseyの技術は、“ホロデッキ”の初期版とも表現されているが、「映像が変わり続ける現象は映画鑑賞やゲームプレイで邪魔になり、実用段階には未だ至っていない」とエド・キャットマルは認めている。彼は、Odysseyが「先駆的な位置につき、この領域のコミュニティに積極的に参加しているため、情報の進歩は続いている」と述べている。彼は、ニューラルネットワークフィルターを使ってこれらの問題を解決していくことを期待している。 背景の補足 世界モデルの研究は、AIが現実世界を再現し、ユーザーがインタラクティブに探索できる新たなエンターテインメント形式の実現に向けた重要なステップだ。これにより、映画やゲーム、教育、トレーニング、トラベルなどが、伝統的な生産方法とは異なる形で提供される可能性がある。Odysseyの技術は、AIが創出する映像をUnreal Engine、Blender、Adobe After Effectsなどのツールでエディットできる機能も提供しており、クリエイターたちにとって新たな創作手法を提供する可能性がある。 専門家の意見では、Odysseyのテクノロジーは非常に急速に進歩していると考えられており、今後の向上が期待されている。しかし、現時点のデモは依然として多くの課題を抱えており、商用化されるにはさらなる改善が必要とのことだ。それでも、AIが現実世界を再現するための新たなアプローチを提示していることは高く評価されるべきであり、この分野の将来性は十分にあると見られている。

関連リンク