Envision Multi-Stage Event Visual Generation Dataset
Envision ist ein Datensatz mit mehreren Bild-Text-Paaren, der 2025 vom Shanghai Artificial Intelligence Laboratory veröffentlicht wurde. Die zugehörige Forschungsarbeit trägt den Titel „Vision: Benchmarking für einheitliches Verständnis und Generierung kausaler WeltprozesseinblickeZiel ist es, die Fähigkeit des Modells zu testen, Kausalzusammenhänge zu verstehen und mehrstufige Ereignisse in realen Situationen zu generieren.
Der Datensatz umfasst 1.000 Ereignissequenzen und 4.000 vierstufige Textanregungen aus sechs Hauptbereichen: Naturwissenschaften und Geisteswissenschaften/Geschichte. Die Ereignismaterialien stammen aus Lehrbüchern und Online-Ressourcen, wurden von Experten ausgewählt und von GPT-4o generiert und optimiert, um narrative Anregungen mit klaren Kausalzusammenhängen und progressiven Stufenstrukturen zu erstellen.
Datenzusammensetzung:
- Themenabdeckung (insgesamt 6 Kategorien)
- Naturwissenschaften (75%): Physik, Chemie, Biologie, Meteorologie, Geographie
- Geschichte und Kultur (25%)
- Kausalstrukturtyp
- Kontinuierliche Kausalität: kontinuierliche Veränderungen innerhalb derselben räumlichen Szene, anwendbar auf feinkörnige physikalische und chemische Prozesse.
- Diskrete Kausalität: Sprünge zwischen Zeit- und Raumstadien, anwendbar auf geologische Evolution, Lebenszyklen und historische Ereignisse.

KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.