Gemini 2.5 Ist Vollständig Aktualisiert, Deep Think Unterstützt Und Besiegt OpenAI

Am frühen Morgen des 21. Mai (Peking-Zeit) fand wie geplant die Google I/O 2025-Konferenz statt. In seiner Grundsatzrede kündigte der CEO des Unternehmens, Sundar Pichai, eine Reihe wichtiger Updates an, die die starken Fähigkeiten und die Wachstumsrate von Google im Bereich der KI deutlich unter Beweis stellten.
„Normalerweise geben wir in den Wochen vor der I/O nicht allzu viele Informationen preis, da wir die wichtigsten Modelle erst auf der Konferenz vorstellen. Doch im Gemini-Zeitalter haben wir vielleicht das intelligenteste Modell an einem Dienstag im März vorgestellt oder spannende Durchbrüche wie AlphaEvolve eine Woche im Voraus angekündigt“, sagte Sundar Pichai. Leser, die Google verfolgen, sollten wissen, dass das Unternehmen kurz vor der Konferenz ein bahnbrechendes neues Modell namens AlphaEvolve herausgebracht hat, das die Erwartungen der Leute an die I/O-Konferenz steigerte.
In der gerade zu Ende gegangenen Grundsatzrede wurde Pichai den Erwartungen gerecht. Neben einer Reihe von Updates für Gemini veröffentlichte er auch die neuesten Entwicklungen von Imagen 4, Veo 3 sowie Headsets, XR-Brillen und anderen Produkten. Dieser Artikel stellt die wichtigsten Updates vor ⬇️
Vollständiges Serienupdate für Gemini 2.5
Deep Think ist kraftvoll
Das Gemini 2.5-Update war erwartungsgemäß, steckte aber auch voller Überraschungen. Google hat im März sein bislang intelligentestes Modell, Gemini 2.5 Pro, auf den Markt gebracht und den Entwicklern vor zwei Wochen das Versionsupdate Gemini 2.5 Pro Preview bereitgestellt. Anschließend übernahm es die Führung in vielen großen Modellbewertungslisten.
Zum Beispiel,Es erreichte 1415 Punkte im Programmier-Benchmark WebDev Arena und landete damit erfolgreich an der Spitze der Liste.

Um die Denkfähigkeiten von Gemini weiter zu erforschen,Google hat mit dem Testen eines erweiterten Denkmodus namens Deep Think begonnen.Bei diesem Ansatz kommen neue Forschungstechniken zum Einsatz, die es dem Modell ermöglichen, mehrere Annahmen zu berücksichtigen, bevor es reagiert.
In Bezug auf die Wirkung,Die Gemini 2.5 Pro Deep Think-Version schneidet bei mehreren schwierigen Benchmarks gut ab und übertrifft OpenAI o3 und o4-mini.Dazu gehören:
* Hervorragende Ergebnisse beim USAMO-Test (United States Mathematical Olympiad) 2025 erzielt;
* Führend in LiveCodeBench, einem schwierigen Benchmark für Programmierkenntnisse auf Wettbewerbsniveau;
* Eine hohe Punktzahl von 84,0% im MMMU (Multi-Modal Reasoning Test), die hervorragende multimodale Denkfähigkeiten beweist.

Darüber hinaus wurde auch die Gemma 3-Serie aktualisiert, um den KI-Anforderungen mobiler Geräte gerecht zu werden.Google hat zusammen mit Qualcomm, MediaTek, Samsung und anderen Herstellern ein neues hochmodernes Framework vorgeschlagen: Gemma 3n.Es verwendet eine innovative Technologie von Google DeepMind – Per-Layer Embeddings (PLE), um eine erhebliche Optimierung der Speichernutzung zu erreichen. Obwohl die ursprünglichen Parametergrößen der Modelle 5 Milliarden (5B) bzw. 8 Milliarden (8B) betragen, können diese größeren Modelle mit der PLE-Technologie auf Mobilgeräten oder in Echtzeit-Inferenz aus der Cloud mit einem Speicher-Overhead ausgeführt werden, der 2 Milliarden (2B) oder 4 Milliarden (4B) Parametermodellen entspricht, d. h., es werden zum Ausführen nur 2 GB bzw. 3 GB dynamischer Speicher benötigt.
Veo 3 und Imagen 4 regen die Kreativität an
Im Vergleich zur vorherigen Generation bietet Veo 3 nicht nur eine deutliche Verbesserung der Videoqualität,Noch wichtiger ist, dass erstmals die gleichzeitige Generierung von Video und Audio möglich war.Ob es sich um den Verkehrslärm auf einer Stadtstraße, Vogelgezwitscher in einem Park oder sogar Gespräche zwischen Figuren handelt, Veo 3 kann basierend auf Textaufforderungen oder Benutzeranforderungen automatisch Audioelemente hinzufügen.
Das Modell zeichnet sich außerdem durch realistische physikalische Phänomene wie Lippensynchronisation aus und ist in der Lage, komplexe Szenenbeschreibungen zu verstehen und in dynamische Videos umzusetzen. Derzeit ist Veo 3 online. Ultra-Abonnenten in den USA können es in der Gemini-Anwendung und in Flow erleben, während Unternehmensbenutzer Nutzungsrechte über die Vertex AI-Plattform erwerben müssen.
Imagen 4 ist eines der Highlights dieses Upgrades.Während der Vorteil der schnellen Bilderzeugung erhalten bleibt, wird der Bilddetailausdruck weiter verbessert.Ob komplizierte Webmuster, Wasserperlen oder Tierhaare, alles lässt sich perfekt wiedergeben.
Darüber hinaus eignet sich Imagen 4 auch hervorragend zur Verarbeitung fotorealistischer und abstrakter Bilder und kann je nach Bedarf qualitativ hochwertige Bilder erzeugen, die sich zum Drucken, Anzeigen und für andere Anlässe eignen. Besonders hervorzuheben sind die stark verbesserten Satzfunktionen, die es sehr gut für die Erstellung von Grußkarten, Postern und sogar Comics geeignet machen. Derzeit wurde Imagen 4 in mehrere Suiten wie Gemini, Whisk, Vertex AI und Google Workspace-Folien, -Videos, -Dokumente usw. integriert, damit Benutzer sie verwenden können.
