HyperAI超神経
Back to Headlines

LTX-Video 13B:30倍速で高精細映像を生成するオープンソースAIモデルが登場

8日前

LTX-Video 13B:30倍速生成高清视频、オープンソースAIがクリエイションの境界を拡大! Lightricks傘下のLTX Studioは、130億のパラメータを持つ最新の大規模動画生成モデル「LTX-Video 13B」を公開しました。このモデルは、従来の30倍の高速生成と革新的なマルチスケールレンダリングテクノロジーにより、消費グレードのGPU(例:NVIDIA RTX 4090)上の効率的な動作が可能になり、業界の注目を集めています。 技術的な突破口:マルチスケールレンダリング LTX-Video 13Bは、まず低解像度で動画の大致の動きやシーン配置を生成し、その後段階的に詳細を加えていく独特のマルチスケールレンダリングテクニックを採用しています。これにより、5秒間の動画を2秒でレンダリングするなど、速度と画質を著しく向上させています。ディフュージョントランスフォーマー(DiT)アーキテクチャに基づき、高度なカーネル最適化とbfloat16データ形式により、さらなるパフォーマンス向上が実現されています。 優れた機能:精密なコントロールと無限の創造性 LTX-Video 13Bは、動作の連続性、シーン構造、およびカメラ Movements の理解の優秀さにより、論理的で詳細豊かな動画コンテンツを生成します。ユーザーはキーフレームコントロール、キャラクターとシーンの移動、多種類のショットの組み合わせなどの細かい制御を行うことができ、映画のような視覚効果を実現できます。さらに、既存の動画を最大60秒まで延長したり、ビデオスタイルや動きを変更したりする機能も備えているため、短編映画の制作、広告のクリエイティブ、そしてソーシャルメディアでのコンテンツ創作に幅広い可能性が開かれています。 オープンソースの生態系:開発者とクリエイターへの強力な支援 LTX-Video 13Bは、GitHubとHugging Face上でオープンソースとして無料提供されており、自由な修正やカスタマイズが可能です。Lightricksは、「LTX-Video-Trainer」ツールも提供しており、2Bと13Bモデルの微調整やLoRA(Low-Rank Adaptation)訓練に対応し、ユーザーが深さセンシング、姿勢検出、エッジ検出など、カスタム制御モデルの開発を容易にするよう設計されています。また、低メモリデバイスでの利用を低減するために、8ビット量化版(ltxv-13b-fp8)やIC-LoRA Detailerなどの補助ツールも発表されています。 年収1000万ドル未満の組織やスタートアップ企業向けに無料提供することで、LightricksはAIの民主化を推進し続けています。 新たな動画生成の時代へ AIbaseは、LTX-Video 13Bの公開が、オープンソースの動画生成テクノロジーが新たな高みへ達したことを示していると考えています。マルチスケールレンダリングと消費グレードハードウェアへの最適화によって、高パフォーマンスデバイスへの依存が減少し、中小規模のチームや個人クリエイターがプロレベルの創作ツールを使用できるようになりました。さらに、オープンソースコミュニティの協力を通じて、動画生成技術の更なる革新と普及が期待されます。 現在、LTX-Video 13BはLTX Studioプラットフォームに統合されており、公式ウェブサイト(https://ltx.studio)やGitHub(https://github.com/Lightricks/LTX-Video)からダウンロードでき、ドキュメントも提供されています。Lightricksは今後も modelos を継続的に最適化し、より多くの制御タイプとマルチモーダル機能をサポートしていく予定です。 試用は以下からできます:https://app.ltx.studio/gen-workspace モデルのダウンロードは:https://ltxv.video/#get-started

Related Links