Command Palette
Search for a command to run...
Ensemble De Données d'instances d'images À Grande Échelle Openstory++
Date
Taille
URL de publication
URL de l'article
L'ensemble de données Openstory++ a été développé conjointement par l'Université de technologie de Chine du Sud, l'Université Westlake, le Centre de recherche américain OPPO et l'Université des sciences et technologies du roi Abdallah en 2024.
Openstory++ est conçu pour résoudre le problème selon lequel les modèles de génération d'images existants ont du mal à maintenir la cohérence des instances dans des contextes de texte longs. Il combine des annotations au niveau de l'instance d'images et de textes, fournissant une ressource riche qui lui permet de générer des images avec une grande cohérence dans le contexte de textes longs. Le développement de cet ensemble de données repose sur une compréhension approfondie du manque de cohérence des modèles de génération d’images existants lorsqu’il s’agit de récits complexes. Grâce à l'extraction automatisée d'images clés, à la génération de sous-titres à l'aide de modèles de langage visuel et au polissage de la cohérence narrative à l'aide de grands modèles de langage, une bibliothèque de ressources à grande échelle est construite pour prendre en charge des tâches complexes de génération narrative.

Construire l'IA avec l'IA
De l'idée au lancement — accélérez votre développement IA avec du co-codage IA gratuit, un environnement prêt à l'emploi et les meilleurs prix GPU.