OmniSVG: Ein einheitliches, skalierbares Modell zur Generierung von Vektorgrafiken
OmniSVG: Ein einheitliches, skalierbares Modell zur Generierung von Vektorgrafiken
Yiying Yang Wei Cheng Sijin Chen Xianfang Zeng Fukun Yin Jiaxu Zhang Liao Wang Gang Yu Xingjun Ma Yu-Gang Jiang

Abstract
Skalierbare Vektorgrafiken (SVG) stellen ein bedeutendes Bildformat dar, das aufgrund seiner auflösungsunabhängigen Darstellung und Bearbeitbarkeit in der Grafikgestaltung weit verbreitet ist. Die Erzeugung hochwertiger SVG-Dateien zieht seit jeher die Aufmerksamkeit sowohl von Designern als auch von Forschern aus der AIGC-Community an. Bisherige Ansätze erzeugen entweder unstrukturierte Ausgaben mit hohem Rechenaufwand oder sind auf die Generierung einfarbiger, übermäßig vereinfachter Symbole beschränkt. Um hochwertige und komplexe SVG-Grafiken zu erzeugen, stellen wir OmniSVG vor – einen einheitlichen Rahmen, der vortrainierte Vision-Sprache-Modelle (VLMs) für die end-to-end-multimodale SVG-Generierung nutzt. Durch die Parameterisierung von SVG-Befehlen und Koordinaten in diskrete Tokens entkoppelt OmniSVG die strukturelle Logik von der niedrigstufigen Geometrie, was eine effiziente Trainingsphase ermöglicht, ohne die Ausdruckskraft komplexer SVG-Strukturen zu beeinträchtigen. Um die Weiterentwicklung der SVG-Synthese voranzutreiben, führen wir MMSVG-2M ein – eine multimodale Datensammlung mit zwei Millionen reichlich annotierten SVG-Assets – sowie ein standardisiertes Evaluationsprotokoll für bedingte SVG-Generierungsaufgaben. Umfangreiche Experimente zeigen, dass OmniSVG bestehende Methoden übertrifft und sein Potenzial für die Integration in professionelle SVG-Design-Workflows demonstriert.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.