Google Gemini erstellt jetzt illustrierte Gutenachtgeschichten mit KI
Google hat mit dem Gemini-Chatbot eine neue Funktion namens „Storybook“ eingeführt, die es Nutzern ermöglicht, interaktive, illustrierte Kinderbücher in nur wenigen Schritten zu erstellen. Durch einfache Texteingaben kann der Benutzer eine Geschichte beschreiben, die dann automatisch in zehn Seiten mit kurzen Textabsätzen und passenden Illustrationen umgesetzt wird. Diese können von Gemini laut vorgelesen werden, was die Funktion besonders für Eltern und Erzieher geeignet macht. Besonders hervorzuheben ist die Anpassungsfähigkeit: Nutzer können spezifische künstlerische Stile vorgeben – von Claymation über Anime bis hin zu Comic- oder Aquarell-Optik. Zudem lässt sich ein eigenes Bild hochladen, etwa eine Zeichnung eines Kindes, die dann als Ausgangspunkt für eine personalisierte Geschichte dient. Bei meinen Tests erzeugte Gemini eine Geschichte über einen Karpfen, der in einem neuen Aquarium Schwierigkeiten hat, Freunde zu finden. Die Handlung war zwar vorhersehbar – etwa ein Versuch, eine Kugel durch das Becken zu bewegen –, doch die visuellen Ergebnisse waren problematisch. Eine Illustration zeigte beispielsweise einem Fisch plötzlich einen menschlichen Arm. In einer anderen Geschichte erschien eine Spaghetti-Sauce wie eine Tatort-Szene aus einem Cartoon, während ein Bild von Mutter und Sohn vor dem Fernseher die Bildschirmseite falsch dargestellt hatte. Auch in einem offiziellen Demo-Video von Google wurde ein künstlerischer Fehler bemerkbar: Eine Frau, die ein Raumschiff baut, macht „klopf, klopf“-Geräusche mit einem Werkzeug, das nicht erkennbar ist – ein klassisches Beispiel für die sogenannte „AI-Weirdness“, bei der KI-Modelle logische oder physische Unstimmigkeiten produzieren. Trotz dieser Fehler blieben andere Geschichten insgesamt konsistent und funktional. Die Sprachausgabe war flüssig, und die Texte entsprachen typischen Kindergeschichten. Allerdings zeigte sich die KI bei der Interpretation einer selbst gezeichneten Katze nicht in der Lage, die ursprüngliche Vorstellung zu erfassen – die Illustrationen entsprachen nicht dem gewünschten Stil. Dies verdeutlicht die Grenzen aktueller multimodaler KI-Systeme, die zwar gut mit Text und Bildern umgehen können, aber oft nicht die kreative Intention des Nutzers verinnerlichen. Die Funktion ist weltweit über Desktop und mobile Geräte nutzbar und unterstützt alle Sprachen, die Gemini aktuell anbietet. Für Eltern und Lehrkräfte ist Storybook eine ansprechende Möglichkeit, kreative Geschichten zu erzeugen, die jedoch aufgrund der visuellen Inkonsistenzen noch nicht vollständig zuverlässig ist. Experten aus der KI-Community sehen die Funktion als frühe, aber vielversprechende Entwicklung im Bereich der generativen Kinderliteratur. Google hat mit Gemini bereits eine starke Position im Bereich künstlicher Intelligenz aufgebaut, und die Erweiterung um kreative, bildbasierte Erzählformate zeigt, wie die Firma versucht, die Interaktion mit KI für alltägliche, emotionale Anwendungen zu stärken. Obwohl die technische Perfektion noch aussteht, ist Storybook ein klares Zeichen dafür, dass KI in Zukunft nicht nur für Informationen, sondern auch für kreative und emotionale Erlebnisse genutzt werden soll.