Command Palette
Search for a command to run...
Ditto-1M-Datensatz Für Anweisungsgesteuerte Videobearbeitung
Datum
Paper-URL
Lizenz
Non-Commercial
Ditto-1M ist ein befehlsgesteuerter Videobearbeitungsdatensatz, der 2025 von der Hong Kong University of Science and Technology, der Ant Group, der Zhejiang University und anderen Institutionen veröffentlicht wurde. Die zugehörigen Papierergebnisse sind „Skalierung der anweisungsbasierten Videobearbeitung mit einem hochwertigen synthetischen Datensatz“, dessen Ziel es ist, die Entwicklung von Videobearbeitungsmodellen auf der Grundlage natürlicher Sprachanweisungen zu fördern und das Verständnis des Modells für komplexe Anweisungen sowie die Genauigkeit der Videogenerierung durch groß angelegte, hochwertige synthetische Beispiele zu verbessern.
Dieser Datensatz enthält etwa 1.000.000 hochpräzise Videobearbeitungs-Triples, die jeweils aus einem Quellvideo, einer Bearbeitungsanweisung und dem bearbeiteten Video bestehen. Jedes Video hat durchschnittlich 101 Bilder und eine Auflösung von 1.280 × 720. Die Bearbeitungsaufgaben sind in drei Kategorien unterteilt:
- Globale Stilübertragung: einschließlich künstlerischer Stiländerungen, Farbkorrektur, visueller Effekte usw.
- Globale Freiformbearbeitung: einschließlich komplexer Szenenänderungen, Umgebungsänderungen, kreativer Transformationen usw.
- Lokale Bearbeitung: umfasst präzise Objektänderungen, Attributänderungen, lokale Anpassungen usw.

KI mit KI entwickeln
Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.