Gemini Live: Visuelle Hilfe und tiefere App-Integration jetzt verfügbar
Gemini Live erhält erweiterte Funktionen, um ein noch natürlicheres und visuell unterstütztes Erlebnis zu bieten. Seit der Einführung im vergangenen Jahr mit dem Pixel 9 ermöglicht das System kontinuierliche, fließende Gespräche mit der KI. Jetzt wird Gemini Live erheblich verbessert: Es ist nun visuell bewusster, ausdrucksstärker und tiefgreifender in Google-Apps integriert. Ein zentraler Fortschritt ist die neue On-Screen-Visualisierung: Wenn Nutzer die Kamera freigeben, erkennt Gemini nicht nur die Umgebung, sondern markiert direkt auf dem Bildschirm relevante Objekte oder Schritte – etwa beim Reparieren eines Geräts oder beim Lernen einer neuen Aufgabe. Diese Echtzeit-Visualisierung wird ab dem 28. August 2024 zunächst auf den Pixel 10-Serien verfügbar sein, danach auch auf anderen Android-Geräten, mit einer baldigen Ausweitung auf iOS. Zusätzlich wird Gemini Live stärker mit den täglichen Google-Apps verbunden. Nutzer können nun direkt mit Google Calendar, Keep und Tasks interagieren – etwa, indem sie eine Termineintragung besprechen und gleichzeitig eine Aufgabe in Google Tasks erstellen lassen. Beim Kochen kann Gemini automatisch Zutaten in eine Einkaufsliste in Google Keep übertragen. In Kürze folgen weitere Integrationen: Mit Messages, Phone und Clock kann Gemini nun auch Nachrichten verfassen, Anrufe tätigen und Erinnerungen setzen. Bei Google Maps wird die Unterstützung erweitert: Wenn man einen neuen Ort sucht, kann Gemini automatisch den besten Weg vorschlagen und bei Bedarf eine Nachricht an einen Kontakt schicken, um Verspätungen anzukündigen – beispielsweise „Ich bin 10 Minuten zu spät, komm einfach später“. Diese Entwicklungen machen Gemini Live zu einem echten Alltagsassistenten, der nicht nur Antworten gibt, sondern komplexe Aufgaben koordiniert. Die Fähigkeit, im Gespräch zu unterbrechen und sofort Aktionen auszulösen – wie ein Anruf oder eine Nachricht – schafft eine nahtlose, menschliche Interaktion. Die Technologie basiert auf fortschrittlichen multimodalen KI-Modellen, die Sprache, Bilder und App-Interaktionen verbinden. Industrieexperten begrüßen die Schritte als Meilenstein für die Zukunft von KI-Assistenten. „Gemini Live zeigt, wie KI über reine Sprachinteraktion hinausgeht – es wird Teil der physischen und digitalen Welt“, sagt ein KI-Experte von TechInsight. Google positioniert sich mit dieser Strategie klar als führender Player im Bereich generativer KI im Alltag. Die kontinuierliche Erweiterung auf verschiedene Plattformen und Apps unterstreicht das Ziel, eine universelle, allgegenwärtige KI-Unterstützung zu schaffen – nicht nur auf Pixel-Geräten, sondern für möglichst viele Nutzer weltweit.