vor 2 Monaten

Minglei Shi Haolin Wang Borui Zhang Wenzhao Zheng Bohan Zeng Ziyang Yuan Xiaoshi Wu Yuanxing Zhang Huan Yang Xintao Wang

Zusammenfassung

Die visuelle Generierung auf der Grundlage von Visual Foundation Model (VFM)-Darstellungen bietet einen äußerst vielversprechenden, einheitlichen Ansatz zur Integration von visuellem Verständnis, Wahrnehmung und Generierung. Trotz dieses Potenzials bleibt die vollständige Ausbildung großer Text-zu-Bild-Diffusionsmodelle innerhalb des VFM-Darstellungsraums weitgehend unerforscht. Um diese Lücke zu schließen, skalieren wir den SVG-(Self-supervised representations for Visual Generation)-Rahmenwerk und stellen SVG-T2I vor, um eine hochwertige Text-zu-Bild-Synthese direkt im VFM-Funktionsraum zu ermöglichen. Durch die Nutzung einer standardisierten Text-zu-Bild-Diffusions-Pipeline erreicht SVG-T2I konkurrenzfähige Ergebnisse mit 0,75 auf GenEval und 85,78 auf DPG-Bench. Diese Leistung bestätigt die inhärente Repräsentationskraft von VFMs für generative Aufgaben. Wir stellen das gesamte Projekt vollständig als Open Source zur Verfügung, inklusive Autoencoder und Generierungsmodell, sowie deren Trainings-, Inferenz- und Evaluationspipelines und vortrainierte Gewichte, um die weitere Forschung im Bereich der repräsentationsgetriebenen visuellen Generierung zu fördern.

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 2 Monaten

Minglei Shi Haolin Wang Borui Zhang Wenzhao Zheng Bohan Zeng Ziyang Yuan Xiaoshi Wu Yuanxing Zhang Huan Yang Xintao Wang

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 2 Monaten

Minglei Shi Haolin Wang Borui Zhang Wenzhao Zheng Bohan Zeng Ziyang Yuan Xiaoshi Wu Yuanxing Zhang Huan Yang Xintao Wang

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

SVG-T2I: Skalierung des Text-zu-Bild-Latent-Diffusionsmodells ohne Variationalen Autoencoder

Minglei Shi Haolin Wang Borui Zhang Wenzhao Zheng Bohan Zeng Ziyang Yuan Xiaoshi Wu Yuanxing Zhang Huan Yang Xintao Wang4 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

SVG-T2I: Skalierung des Text-zu-Bild-Latent-Diffusionsmodells ohne Variationalen Autoencoder

Minglei Shi Haolin Wang Borui Zhang Wenzhao Zheng Bohan Zeng Ziyang Yuan Xiaoshi Wu Yuanxing Zhang Huan Yang Xintao Wang4 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

SVG-T2I: Skalierung des Text-zu-Bild-Latent-Diffusionsmodells ohne Variationalen Autoencoder

Minglei Shi Haolin Wang Borui Zhang Wenzhao Zheng Bohan Zeng Ziyang Yuan Xiaoshi Wu Yuanxing Zhang Huan Yang Xintao Wang4 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Minglei Shi Haolin Wang Borui Zhang Wenzhao Zheng Bohan Zeng Ziyang Yuan Xiaoshi Wu Yuanxing Zhang Huan Yang Xintao Wang

Minglei Shi Haolin Wang Borui Zhang Wenzhao Zheng Bohan Zeng Ziyang Yuan Xiaoshi Wu Yuanxing Zhang Huan Yang Xintao Wang

Minglei Shi Haolin Wang Borui Zhang Wenzhao Zheng Bohan Zeng Ziyang Yuan Xiaoshi Wu Yuanxing Zhang Huan Yang Xintao Wang