4ヶ月前

拡散モデル

画像間変換

アプローチ／フレームワーク

マルチモーダル

Yi Xin Qi Qin Siqi Luo Kaiwen Zhu Juncheng Yan Yan Tai Jiayi Lei Yuewen Cao Keqi Wang Yibin Wang

概要

Lumina-DiMOO を紹介します。これは、シームレスなマルチモーダル生成と理解を実現するオープンソースの基礎モデルです。Lumina-DiMOO は、さまざまなモダリティの入出力を処理するために、完全に離散的な拡散モデル（discrete diffusion modeling）を採用することで、従来の統合型モデルとは差別化されています。この革新的なアプローチにより、従来の自己回帰型（autoregressive, AR）または AR-拡散ハイブリッドモデルと比較して、より高いサンプリング効率を達成するとともに、テキストから画像生成、画像から画像生成（例：画像編集、対象駆動型生成、画像補完など）、および画像理解を含む幅広いマルチモーダルタスクを効果的にサポートします。Lumina-DiMOO は複数のベンチマークにおいて最先端の性能を達成しており、既存のオープンソース統合型マルチモーダルモデルを上回っています。マルチモーダルおよび離散拡散モデル分野のさらなる進展を促進するため、本研究ではコードおよびモデルチェックポイントをコミュニティに公開します。プロジェクトページ：https://synbol.github.io/Lumina-DiMOO

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

4ヶ月前

拡散モデル

画像間変換

アプローチ／フレームワーク

マルチモーダル

Yi Xin Qi Qin Siqi Luo Kaiwen Zhu Juncheng Yan Yan Tai Jiayi Lei Yuewen Cao Keqi Wang Yibin Wang

概要

Lumina-DiMOO を紹介します。これは、シームレスなマルチモーダル生成と理解を実現するオープンソースの基礎モデルです。Lumina-DiMOO は、さまざまなモダリティの入出力を処理するために、完全に離散的な拡散モデル（discrete diffusion modeling）を採用することで、従来の統合型モデルとは差別化されています。この革新的なアプローチにより、従来の自己回帰型（autoregressive, AR）または AR-拡散ハイブリッドモデルと比較して、より高いサンプリング効率を達成するとともに、テキストから画像生成、画像から画像生成（例：画像編集、対象駆動型生成、画像補完など）、および画像理解を含む幅広いマルチモーダルタスクを効果的にサポートします。Lumina-DiMOO は複数のベンチマークにおいて最先端の性能を達成しており、既存のオープンソース統合型マルチモーダルモデルを上回っています。マルチモーダルおよび離散拡散モデル分野のさらなる進展を促進するため、本研究ではコードおよびモデルチェックポイントをコミュニティに公開します。プロジェクトページ：https://synbol.github.io/Lumina-DiMOO

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Lumina-DiMOO：マルチモーダル生成および理解を目的としたオムニ拡散大規模言語モデル | 記事 | HyperAI超神経