HyperAIHyperAI

Command Palette

Search for a command to run...

Hochauflösende Bilderrahmeninterpolation mit patchbasiertem kaskadierten Diffusionsverfahren

Hur Junhwa ; Herrmann Charles ; Saxena Saurabh ; Kontkanen Janne ; Lai Wei-Sheng ; Shih Yichang ; Rubinstein Michael ; Fleet David J. ; Sun Deqing

Zusammenfassung

Trotz der jüngsten Fortschritte kämpfen bestehende Verfahren zur Framesinterpolation weiterhin mit der Verarbeitung von extrem hochaufgelösten Eingaben und der Bewältigung anspruchsvoller Fälle wie wiederholten Texturen, dünnen Objekten und großen Bewegungen. Um diese Probleme anzugehen, stellen wir ein patchbasiertes kaskadiertes Pixel-Diffusionsmodell für hochaufgelöste Framesinterpolation vor, das als HiFI bezeichnet wird. HiFI zeichnet sich durch eine herausragende Leistung in diesen Szenarien aus und erreicht gleichzeitig wettbewerbsfähige Ergebnisse bei Standard-Benchmarks.Kaskaden, die eine Reihe von Bildern von niedriger zu hoher Auflösung generieren, können bei großen oder komplexen Bewegungen erheblich helfen, die sowohl globale Kontextinformationen für eine grobe Lösung als auch detaillierte Kontextinformationen für hochaufgelöste Ausgaben benötigen. Im Gegensatz zu früheren Arbeiten über kaskadierte Diffusionsmodelle, die auf steigenden Auflösungen Diffusion durchführen, verwenden wir ein einzelnes Modell, das stets auf derselben Auflösung Diffusion durchführt und durch die Verarbeitung von Patchs der Eingaben und der vorherigen Lösung aufsamplet. Bei der Inferenz reduziert dies den Speicherverbrauch erheblich und ermöglicht es einem einzigen Modell, sowohl die Framesinterpolation (die Aufgabe des Basismodells) als auch die räumliche Aufsampling zu lösen, was auch die Trainingskosten spart.HiFI leistet hervorragend bei hochaufgelösten Bildern und komplexen wiederholten Texturen, die einen globalen Kontext erfordern. Es erreicht vergleichbare oder bahnbrechende Leistungen bei verschiedenen Benchmarks (Vimeo, Xiph, X-Test und SEPE-8K). Wir führen außerdem einen neuen Datensatz ein, LaMoR (Large Motion and Repetitive Textures), der sich besonders anspruchsvollen Fällen widmet. Hierbei übertrifft HiFI andere Baseline-Verfahren deutlich. Bitte besuchen Sie unsere Projektseite für Videoergebnisse: https://hifi-diffusion.github.io


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Hochauflösende Bilderrahmeninterpolation mit patchbasiertem kaskadierten Diffusionsverfahren | Paper | HyperAI