HyperAI
Back to Headlines

Google stellt Gemini Deep Think vor – neues KI-Modell mit paralleler Ideenprüfung

vor 5 Tagen

Google DeepMind stellt Gemini 2.5 Deep Think vor, seinen fortschrittlichsten KI-Modell für logisches Denken, der ab Freitag Abonnenten des teuren Ultra-Abonnements zu 250 Dollar pro Monat im Gemini-App zur Verfügung steht. Erstmals vorgestellt auf der Google I/O 2025, ist Deep Think der erste öffentlich zugängliche Multi-Agenten-Modell von Google. Im Gegensatz zu herkömmlichen KI-Systemen, die eine Antwort sequenziell generieren, erzeugt Deep Think gleichzeitig mehrere kognitive „Agenten“, die parallel verschiedene Lösungsansätze erkunden. Dieser ressourcenintensive Prozess ermöglicht tiefere, kreativere und präzisere Antworten – besonders bei komplexen Problemen, die strategisches Planen, kritisches Denken oder schrittweise Verbesserungen erfordern. Google nutzte eine Variante von Gemini 2.5 Deep Think, um eine Goldmedaille bei der Internationalen Mathematik-Olympiade (IMO) zu gewinnen. In Zusammenarbeit mit Wissenschaftlern wird nun eine spezielle Version dieses Modells – die bis zu Stunden für die Erkundung von Lösungswegen benötigt – einer ausgewählten Gruppe von Mathematikern und Forschern zur Verfügung gestellt. Ziel ist es, Feedback zu sammeln, um die Multi-Agenten-Systeme für akademische Anwendungen weiter zu optimieren. Im Vergleich zu anderen führenden KI-Modellen zeigt Deep Think herausragende Leistungen: Auf dem Humanity’s Last Exam (HLE), einem anspruchsvollen Test mit Tausenden Fragen aus Mathematik, Naturwissenschaften und Geisteswissenschaften, erreichte es 34,8 Prozent – deutlich mehr als xAI’s Grok 4 (25,4 Prozent) und OpenAI’s o3 (20,3 Prozent). Bei LiveCodeBench6, einem Benchmark für kompetitive Programmieraufgaben, erzielte es 87,6 Prozent, gegenüber 79 Prozent bei Grok 4 und 72 Prozent bei o3. Deep Think arbeitet automatisch mit Tools wie Code-Execution und Google-Suche und kann längere, detailliertere Antworten generieren. In Tests übertraf es andere Modelle auch bei der Erstellung anspruchsvoller Web-Entwicklungsaufgaben und ästhetisch ansprechender künstlerischer Szenen. Google sieht darin ein Potenzial, Forschungsprozesse zu beschleunigen und neue Entdeckungen zu ermöglichen. Die Multi-Agenten-Strategie ist mittlerweile ein gemeinsamer Trend bei führenden KI-Laboren: Elon Musks xAI veröffentlichte ebenfalls einen Multi-Agenten-Modell namens Grok 4 Heavy, der starke Benchmark-Ergebnisse erzielte. OpenAI nutzte ebenfalls ein Multi-Agenten-System für die IMO-Goldmedaille, und Anthropic setzt auf ähnliche Architekturen für seine Forschungs-Agenten. Allerdings sind solche Systeme extrem rechenintensiv und teuer in der Bereitstellung – daher bleiben sie vorerst auf Premium-Abonnements wie Google Ultra oder xAI’s Pro-Plan beschränkt. Google plant, in den kommenden Wochen eine Version von Gemini 2.5 Deep Think über die Gemini-API für eine kleine Gruppe von Entwicklern und Unternehmen freizugeben, um deren Einsatz in der Industrie besser zu verstehen. Die Technologie basiert auf erweitertem „Denkzeit“ – durch längere Inferenzzeiten kann das Modell mehr Hypothesen erforschen und über die Zeit Ideen verfeinern oder kombinieren. Zusätzlich hat Google neuartige Verstärkungslernverfahren entwickelt, die das Modell dazu bringen, seine Gedankengänge effizienter zu nutzen und sich kontinuierlich zu verbessern. Insgesamt markiert Deep Think einen wichtigen Schritt hin zu künstlicher Intelligenz, die nicht nur schnell, sondern auch tief und kreativ denken kann.

Related Links