Neues KI-Tool erzeugt Bilder aus jeder Perspektive mit hoher Genauigkeit
Ein neuartiges KI-Modell namens Qwen-Image-Edit-2511-Multiple-Angles-LoRA hat in den letzten Tagen Aufmerksamkeit in der KI-Community und auf sozialen Medien gefunden, da es die Fähigkeit besitzt, ein Bild aus nahezu beliebigen Perspektiven neu zu generieren – mit hoher Genauigkeit und konsistenter Szenenwiedergabe. Im Gegensatz zu herkömmlichen Bildgeneratormodellen, die oft nur neue Szenen aus dem Nichts erschaffen, kann dieses Modell ein bestehendes Bild analysieren und es aus 96 präzise definierten Kameraposen neu interpretieren: Distanz, Höhe (Elevation) und Blickwinkel (Azimuth) sind vollständig anpassbar. Dies ermöglicht beispielsweise die Umwandlung eines Frontalbildes in eine seitliche Ansicht, eine Hoch- oder Tiefblickperspektive oder eine vergrößerte Nahaufnahme – alles unter Beibehaltung der ursprünglichen Subjektkonsistenz. Ein prominentes Beispiel ist die Neubearbeitung des Charakters Forrest Gump in verschiedenen Winkeln, die von Flux Labs mit dem Modell erstellt wurden. Auch bei einem einfachen Objekt wie einem Hund zeigt sich die Leistungsfähigkeit: Ein Bild, das ursprünglich aus der Mitte und auf Augenhöhe aufgenommen wurde, kann nun präzise in eine rechte Seitenansicht umgewandelt werden, wobei Gesichtszüge, Körperhaltung und Kleidung nahezu identisch bleiben. Besonders bemerkenswert ist die Fähigkeit des Modells, die Hintergründe konsistent und plausibel zu ergänzen – selbst wenn der neue Blickwinkel Teile des ursprünglichen Szenenraums verdeckt oder neue Sichtweisen erfordert. Die KI leitet dabei sinnvolle Umgebungsdetails ab, wie z. B. Bodenbeläge, Lichtverhältnisse oder Hintergrundgegenstände, die in der neuen Perspektive logisch erscheinen. Das Modell basiert auf der Qwen-Image-Edit-Plattform und nutzt eine LoRA-Technologie (Low-Rank Adaptation), die es ermöglicht, das Modell effizient auf spezifische Aufgaben anzupassen, ohne das gesamte Modell neu zu trainieren. Dadurch ist es besonders ressourcensparend und gut für Open-Weights-Ansätze geeignet, was die breite Nutzung und Weiterentwicklung fördert. Die hohe Präzision bei der Perspektivenveränderung macht es besonders nützlich für Anwendungen in der Filmproduktion, Architekturvisualisierung, Spieleentwicklung oder der digitalen Erhaltung von Fotografien. Branchenexperten begrüßen das Modell als bedeutenden Fortschritt im Bereich der Bildtransformation. „Es ist eine der ersten KI-Lösungen, die nicht nur eine neue Perspektive erzeugt, sondern dabei auch die konsistente Identität des Subjekts und die logische Struktur der Umgebung bewahrt“, sagt ein KI-Forschungsleiter von einem europäischen Tech-Institut. „Das könnte die Art und Weise, wie wir digitale Inhalte erstellen, grundlegend verändern.“ Qwen, entwickelt von Alibaba Cloud, positioniert sich als Open-Source-Alternative zu Modellen wie Stable Diffusion oder DALL·E und gewinnt zunehmend an Bedeutung in der KI-Community. Mit seiner Fähigkeit zur mehrwinkeligen Bildrekonstruktion erweitert es die Grenzen der kreativen KI-Nutzung – und könnte bald ein Standardwerkzeug für Künstler, Designer und Entwickler werden.
