HyperAI

Im Kontext der kontinuierlichen Weiterentwicklung von generativer KI stärkt OpenAI seine Bildgenerierungsfähigkeiten. Am Dienstag vor Ort veröffentlichte das Unternehmen offiziell „ChatGPT Images 2.0", ein neues Modell für die Bilderzeugung, das als in gewissem Maße „denkfähig" beschrieben wird. Es kann nicht nur auf Basis von Prompts Bilder erstellen, sondern auch durch Abgleich mit Online-Informationen eine „sekundäre Validierung" seiner Ausgaben durchführen, um deren Plausibilität und Konsistenz zu verbessern. Wie aus offiziellen Beispielen hervorgeht, hat sich dieses Modell hinsichtlich Realitätsnähe und Darstellungsmöglichkeiten weiterentwickelt. So wurden einige erzeugte Inhalte bewusst so gestaltet, dass sie wie „Screenshots innerhalb eines Screenshots" wirken oder Szenarien simulieren, bei denen Nutzer physische Zeitschriften blättern – wodurch die Grenze zwischen von KI generierten Bildern und echten Fotografien zunehmend verschwimmt. Sam Altman bewertete im Rahmen einer Live-Schaltsendung zum Launch: „Das Team hat an diesem Modell hervorragende Arbeit geleistet." Funktionale Aspekte von ChatGPT Images 2.0 beinhalten die Unterstützung mehrsprachiger Eingabeaufforderungen unter anderem in Chinesisch, Japanisch, Koreanisch, Hindi und Bengali. Das Modell ist zudem in der Lage, verschiedene Formate wie Werbeanzeigen, Magazinseiten sowie Comic-Inhalte zu produzieren. Darüber hinaus ermöglicht es stilistische Neugestaltungen realer Personen, etwa indem bekannte Investoren in den Stil der 1980er-Jahre transformiert werden. Auf Fragen bezüglich Urheberrechten erklärte OpenAI, das Modell kopiere oder reproduziere keine spezifischen Werke, sondern erzeuge Inhalte basierend auf gelernten Mustern. Gleichzeitig beschränke das Unternehmen die Nachahmung des persönlichen Stils lebender Künstler, erlaubt jedoch die Generierung in einem breiter gefassten Studio-Stil. Mitch Stoltz merkte dazu an, solange die erstellten Inhalte keine wesentliche Ähnlichkeit mit konkreten Werken aus dem Trainingsdatensatz aufweisen, stelle dies in der Regel keinen Verstoß gegen Urheberrechte dar. Trotzdem bleiben angesichts zunehmender Realitätstreue von KI-generierten Inhalten entsprechende Kontroversen bestehen. Derzeit sieht sich OpenAI mehreren Klagen wegen Urheberrechtsverletzungen gegenüberstehen, darunter Initiativen der Zeitung „The New York Times" sowie des Autors George R. R. Martin. Branchenexperten sind weitgehend der Auffassung, dass zwar die Technologie selbst herkömmlichen Bildbearbeitungswerkzeugen ähnelt, ihre Effizienzsteigerung und Skalierbarkeit jedoch die daraus resultierenden gesellschaftlichen und rechtlichen Auswirkungen verstärken.

Verwandte Links

Verwandte Links

Verwandte Links

ByteDance Veröffentlicht Lance Als Open Source, Ein 3B-Modell, Das Verstehen, Generieren Und Bearbeiten Umfasst; Die National University of Singapore Schlägt Den ViMU-Datensatz Vor: Er Umfasst 588 Videos Und Nonverbale Fragebeantwortung.

ByteDance Veröffentlicht Lance Als Open Source, Ein 3B-Modell, Das Verstehen, Generieren Und Bearbeiten Umfasst; Die National University of Singapore Schlägt Den ViMU-Datensatz Vor: Er Umfasst 588 Videos Und Nonverbale Fragebeantwortung.

Command Palette

OpenAI veröffentlicht ChatGPT Images 2.0: Einführung von „Denkfähigkeiten" für realistischer generierte Inhalte

Verwandte Links

Command Palette

OpenAI veröffentlicht ChatGPT Images 2.0: Einführung von „Denkfähigkeiten" für realistischer generierte Inhalte

Verwandte Links

Command Palette

OpenAI veröffentlicht ChatGPT Images 2.0: Einführung von „Denkfähigkeiten" für realistischer generierte Inhalte

Verwandte Links

ByteDance Veröffentlicht Lance Als Open Source, Ein 3B-Modell, Das Verstehen, Generieren Und Bearbeiten Umfasst; Die National University of Singapore Schlägt Den ViMU-Datensatz Vor: Er Umfasst 588 Videos Und Nonverbale Fragebeantwortung.

ByteDance Veröffentlicht Lance Als Open Source, Ein 3B-Modell, Das Verstehen, Generieren Und Bearbeiten Umfasst; Die National University of Singapore Schlägt Den ViMU-Datensatz Vor: Er Umfasst 588 Videos Und Nonverbale Fragebeantwortung.