HyperAI
Back to Headlines

DeepMind und OpenAI siegen bei Olympiade der Mathematik

vor 14 Stunden

Google DeepMind hat am Montag bekannt gegeben, dass eine erweiterte Version seines Künstlichen Intelligenz-Modells Gemini auf der International Mathematical Olympiad (IMO) die Leistung eines Goldmedaillengewinners erzielt hat. Das Modell löste fünf von sechs extrem schwierigen Aufgaben und erhielt offiziell die Goldnote von den Wettbewerbsorganisatoren. Dies stellt einen wichtigen Meilenstein im Bereich der kognitiven Fähigkeiten von KI dar und setzt Google in den Wettkampf zwischen Tech-Giganten, die nächste Generation KI entwickeln, in die Spitze. Die IMO, seit 1959 jährlich ausgetragen, gilt als die prestigeträchtigste Mathematikwettbewerbs für Schüler vor dem Universitätsstudium. Jedes teilnehmende Land entsendet sechs Elite-Mathematiker, die sechs Aufgaben in Algebra, Kombinatorik, Geometrie und Zahlentheorie lösen müssen. Goldmedaillen werden nur etwa 8% der Teilnehmer verliehen. Im vergangenen Jahr erreichte Google DeepMinds kombinierte System AlphaProof und AlphaGeometry 2 den Silberstatus, indem es vier von sechs Aufgaben löste und 28 Punkte sammelte. Dieses System benötigte jedoch menschliche Experten, um die natürlichsprachlichen Aufgaben in spezialisierte Programmiersprachen zu übersetzen und die Lösungen zurück zu interpretieren. Dieses Jahr gelang der Durchbruch durch Gemini Deep Think, ein erweitertes KI-Modell, das „paralleles Denken“ nutzt. Im Gegensatz zu traditionellen KI-Modellen, die einem einzelnen Gedankenkette folgen, erforscht Gemini Deep Think gleichzeitig mehrere mögliche Lösungswege, bevor es eine endgültige Antwort gibt. Das Modell arbeitete von Anfang bis Ende in natürlicher Sprache, generierte rigorose mathematische Beweise direkt aus den offiziellen Aufgabendescriptions und schaffte dies innerhalb der 4,5 Stunden des Wettbewerbs. Die Lösungen wurden von IMO-Prüfern als klug, präzise und meist leicht verständlich bewertet. Der Sieg wurde durch neuartige Trainingsmethoden erreicht, darunter fortgeschrittene Verstärkungslernalgorithmen, die auf mehrstufiges Denken, Problemlösung und Theorembeweis abzielen. Das Modell hatte Zugang zu einer kuratierten Sammlung hochwertiger mathematischer Lösungen und erhielt spezifische Anleitungen zur Bearbeitung von IMO-Aufgaben. Diese Methoden ermöglichten es Gemini, komplexe mathematische Probleme zu lösen, ohne spezialisierte Formalsprachen zu benötigen. Die Leistung von Gemini Deep Think überraschte auch die mathematische Gemeinschaft. In einem besonders schwierigen Problem, bei dem viele menschliche Konkurrenten fortgeschrittene mathematische Konzepte anwendeten, fand Gemini eine elegante Lösung, die nur elementare Zahlentheorie erforderte. Dies zeigt, dass KI-Systeme nicht nur auf spezialisierte Domänen abgestellt, sondern vielmehr flexibel und intuitiv trainiert werden können, um anspruchsvolle Aufgaben zu lösen. Das Ereignis findet in einem kritischen Moment statt, in dem Unternehmen um die Vorherrschaft in der KI-Branche kämpfen. Google plant, eine Version dieses Deep Think-Modells Mathematikern zur Prüfung zur Verfügung zu stellen, bevor es an Google AI Ultra Abonnenten, die 250 Dollar pro Monat bezahlen, weitergegeben wird. Die Entwicklung signalisiert, dass KI bald in verschiedenen Branchen komplexe analytische Probleme lösen kann, ohne spezialisierte Programmierung oder Fachwissen zu erfordern. Im Gegensatz dazu hat OpenAI kürzlich heftige Kritik erntet, da es seine eigenen IMO-Ergebnisse ohne Teilnahme am offiziellen Prüfungsprozess veröffentlichte. Stattdessen wurden die Lösungen von einem Panel ehemaliger IMO-Teilnehmer bewertet, was von Teilen der KI-Gemeinschaft als mangelnd an Glaubwürdigkeit angesehen wird. OpenAI behauptet, dass sein experimentelles Modell ebenfalls fünf von sechs Aufgaben löste und 35 von 42 möglichen Punkten erzielte. Google DeepMind-Forscher Thang Luong bestreitet jedoch, dass OpenAIs Ergebnisse nach den internen Bewertungsrichtlinien der IMO den Goldstandard erreicht hätten. Die mathematische Meisterschaft der KI hat weitreichende Implikationen. Es demonstriert, dass KI-Systeme nun menschliches Denken in komplexen Aufgaben, die Kreativität, abstraktes Denken und die Synthese von Einsichten aus verschiedenen Bereichen erfordern, nachvollziehen können. Analysten hatten noch vor kurzem geschätzt, dass die Wahrscheinlichkeit, dass ein KI-System bis 2025 Gold bei der IMO gewinnen würde, nur 18% betrug. Diese rasche Fortschrittspace in der KI-Industrie deutet darauf hin, dass KI-Systeme in Zukunft wichtige Beiträge zur wissenschaftlichen Entdeckung leisten werden. Allerdings bleibt die Frage, ob diese Fähigkeiten in der realen Welt, wo Herausforderungen oft unklarer und vielschichtiger sind, effektiv umgesetzt werden können. Die IMO bietet gut definierte Probleme mit klaren Erfolgskriterien, während die meisten Geschäftsfälle und wissenschaftlichen Fragen viel offener gestellt sind. Google DeepMind plant, beim nächsten Jahrhundertwettbewerb „eine perfekte Note“ zu erzielen. Das Unternehmen glaubt, dass KI-Systeme, die natürlichsprachliche Fluigkeit mit rigorosem Denken kombinieren, wertvolle Werkzeuge für Mathematiker, Wissenschaftler, Ingenieure und Forscher werden, um das menschliche Wissen weiterzuentwickeln. Die IMO ist die prestigeträchtigste Mathematikwettbewerb für Schüler vor dem Studium und findet jährlich statt. Die Leistung von Google DeepMind zeigt, dass die KI-Industrie rapide voranschreitet und dass KI-Modelle zunehmend in der Lage sind, komplexe Aufgaben zu lösen, die bisher menschlichen Intellekt vorbehalten waren. Die mathematische Meisterschaft von Gemini Deep Think unterstreicht die Bedeutung eines ethisch verantwortungsvollen und transparenten Ansatzes in der KI-Entwicklung, der sowohl die wissenschaftliche Gemeinschaft als auch die breitere Öffentlichkeit berücksichtigt.

Related Links