vor 4 Monaten

Qingyan Bai Qiuyu Wang Hao Ouyang Yue Yu Hanlin Wang Wen Wang Ka Leong Cheng Shuailei Ma Yanhong Zeng Zichen Liu

Zusammenfassung

Die an Anweisungen orientierte Videobearbeitung verspricht, die Content-Erstellung zu demokratisieren, wird jedoch durch die knappe Verfügbarkeit großer, hochwertiger Trainingsdaten erheblich behindert. Wir stellen Ditto vor, einen umfassenden Rahmen, der diese zentrale Herausforderung angeht. Im Kern verfügt Ditto über eine neuartige Datengenerierungspipeline, die die kreative Vielfalt eines führenden Bildeditors mit einem kontextbasierten Videogenerator verbindet und so die begrenzte Funktionsbreite bestehender Modelle überwindet. Um diesen Prozess praktikabel zu machen, löst unser Framework das problematische Kosten-Qualität-Verhältnis durch eine effiziente, reduzierte Modellarchitektur, die durch einen zeitlichen Verbesserungsmodul ergänzt wird. Dieser verringert gleichzeitig den Rechenaufwand und steigert die zeitliche Kohärenz. Schließlich ermöglicht ein intelligentes Agens, das die gesamte Pipeline steuert, eine vollständige Skalierbarkeit, indem es vielfältige Anweisungen generiert und die Ausgabe rigoros filtert, um eine qualitativ hochwertige Kontrolle im großen Maßstab sicherzustellen. Mit diesem Framework haben wir über 12.000 GPU-Tage investiert, um Ditto-1M, eine neue Datensammlung mit einer Million hochfidelitätsreicher Beispiele für Videobearbeitung, zu erstellen. Wir haben unser Modell Editto mit einer Curriculum-Learning-Strategie auf Ditto-1M trainiert. Die Ergebnisse belegen eine überlegene Fähigkeit zur Anweisungsausführung und etablieren eine neue State-of-the-Art in der an Anweisungen orientierten Videobearbeitung.

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 4 Monaten

Qingyan Bai Qiuyu Wang Hao Ouyang Yue Yu Hanlin Wang Wen Wang Ka Leong Cheng Shuailei Ma Yanhong Zeng Zichen Liu

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 4 Monaten

Qingyan Bai Qiuyu Wang Hao Ouyang Yue Yu Hanlin Wang Wen Wang Ka Leong Cheng Shuailei Ma Yanhong Zeng Zichen Liu

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Skalierung der video-basierten Bearbeitung auf der Grundlage von Anweisungen mit einem hochwertigen synthetischen Datensatz

Qingyan Bai Qiuyu Wang Hao Ouyang Yue Yu Hanlin Wang Wen Wang Ka Leong Cheng Shuailei Ma Yanhong Zeng Zichen Liu3 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Skalierung der video-basierten Bearbeitung auf der Grundlage von Anweisungen mit einem hochwertigen synthetischen Datensatz

Qingyan Bai Qiuyu Wang Hao Ouyang Yue Yu Hanlin Wang Wen Wang Ka Leong Cheng Shuailei Ma Yanhong Zeng Zichen Liu3 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Skalierung der video-basierten Bearbeitung auf der Grundlage von Anweisungen mit einem hochwertigen synthetischen Datensatz

Qingyan Bai Qiuyu Wang Hao Ouyang Yue Yu Hanlin Wang Wen Wang Ka Leong Cheng Shuailei Ma Yanhong Zeng Zichen Liu3 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Qingyan Bai Qiuyu Wang Hao Ouyang Yue Yu Hanlin Wang Wen Wang Ka Leong Cheng Shuailei Ma Yanhong Zeng Zichen Liu

Qingyan Bai Qiuyu Wang Hao Ouyang Yue Yu Hanlin Wang Wen Wang Ka Leong Cheng Shuailei Ma Yanhong Zeng Zichen Liu

Qingyan Bai Qiuyu Wang Hao Ouyang Yue Yu Hanlin Wang Wen Wang Ka Leong Cheng Shuailei Ma Yanhong Zeng Zichen Liu