Openstory++ 大規模画像インスタンス データセット
Openstory++ データセットは、2024 年に華南理工大学、ウェストレイク大学、OPPO American Research Center、キング アブドラ科学技術大学によって共同開発されました。
Openstory++ は、長いテキスト コンテキストでインスタンスの一貫性を維持するのに苦労している既存の画像生成モデルの問題を解決するように設計されています。画像とテキストのインスタンスレベルの注釈を組み合わせて豊富なリソースを提供し、長いテキストのコンテキストで一貫性の高い画像を生成できるようにします。このデータセットの開発は、自動化されたキーフレーム抽出、字幕の視覚言語モデル生成、および物語の一貫性のための大規模な言語モデルを通じて、複雑な物語を扱う際の既存の画像生成モデルの一貫性の欠如についての深い理解に基づいています。ポーランドでは、複雑な物語生成タスクをサポートする大規模なリソース ライブラリを構築しています。

OpenstoryPlusPlus.torrent
シーディング 1ダウンロード中 1ダウンロード完了 87総ダウンロード数 81