Command Palette
Search for a command to run...
Ensemble De Données De Génération d'images Synthétiques Echo-4o-Image
Date
Size
Paper URL
License
MIT
Echo-4o-Image est un jeu de données d'images de synthèse publié en 2025 par le Laboratoire d'intelligence artificielle de Shanghai, en collaboration avec l'Université Sun Yat-sen, le Laboratoire multimédia (MMLab) de l'Université chinoise de Hong Kong et d'autres institutions. Les résultats de l'étude sont les suivants :Echo-4o : Exploiter la puissance des images synthétiques GPT-4o pour une génération d'images améliorée", qui vise à améliorer la capacité du modèle open source à générer du texte à partir d'images.
Cet ensemble de données est généré par GPT-4o et contient environ 179 000 échantillons, couvrant trois types de tâches différents :
- Exécution d'instructions complexes (environ 68 000), renforçant la conformité avec des textes longs/détaillés ;
- Génération Fantastique Surréaliste (environ 38 000), axée sur le contenu imaginatif ;
- Génération d'images multi-références (environ 73 000), adaptée aux scènes nécessitant plusieurs repères visuels.
Chaque échantillon est une grille d’images 2×2 avec une résolution de 1024×1024, contenant le chemin de l’image, les caractéristiques (attributs/sujets) et les informations structurées de l’invite générée.

Build AI with AI
From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.