OpenAI gewinnt Gold bei Internat. Mathematik-Olympiade
OpenAI hat bei der prestigeträchtigsten Mathewettbewerbs der Welt, der International Math Olympiad (IMO), Gold gewonnen. Dies ist ein bedeutender Meilenstein im Bereich Künstliche Intelligenz (KI) und zeigt den Fortschritt, den diese Technologie in den letzten Jahren gemacht hat. Alexander Wei, ein Mitglied des technischen Teams von OpenAI, gab auf X (früher Twitter) bekannt: "Ich freue mich, mitteilen zu können, dass unser neuestes experimentelles Reasoning-Modell von OpenAI einen langjährigen Großherausforderung im AI-Bereich gemeistert hat: Goldmedaillenleistung bei der prestigeträchtigsten Mathewettbewerbs der Welt – der International Math Olympiad (IMO)." Die IMO ist ein globaler Wettbewerb, der 1959 in Rumänien begann und heute als einer der schwierigsten auf der Welt gilt. Die Teilnehmer haben zwei Tage Zeit, an denen sie jeweils eine vierstündige Prüfung mit drei Fragen absolvieren müssen. Bekannte Gewinner sind Grigori Perelman, der die Geometrie vorangebracht hat, und Terence Tao, Träger der Fields-Medaille, dem höchsten Ehrenpreis in der Mathematik. Im Juni hatte Tao in der Podcast-Reihe von Lex Fridman vorhergesagt, dass KI auf der IMO nicht hoch punkten würde. Er riet den Forschern, ihre Ziele etwas niedriger zu setzen und kleinere Wettbewerbe anzustreben, bei denen die Antworten einfache Zahlen und keine komplexen Beweise sind. Dennoch löste OpenAI's neuestes Modell fünf von sechs Aufgaben korrekt, unter den gleichen Testbedingungen wie die menschlichen Teilnehmer, berichtete Wei. Weis Kollege, Noam Brown, betonte, dass das Modell während des Exams eine neue Ebene an Ausdauer gezeigt hat. "Die IMO-Aufgaben erfordern ein neues Maß an kreativem Denken, verglichen mit früheren Benchmarks," sagte er. "Dieses Modell denkt längere Zeit nach." Wei behauptete, dass das Modell eine Verbesserung in der allgemeinen Intelligenz darstellt. Die Leistung des Modells ist "ein Novum im Bereich der allgemeinen reinforcement learning," fügte er hinzu. Im Gegensatz dazu ist DeepMinds AlphaGeometry speziell darauf ausgelegt, Mathematikaufgaben zu lösen. Sam Altman, CEO von OpenAI, schrieb ebenfalls auf X: "Dies ist ein sprachliches Modell, das Mathematik macht und kein spezifisches formales Mathesystem; es ist Teil unseres Hauptansatzes zur allgemeinen Intelligenz." Er betonte, dass dies ein Traum war, als OpenAI gegründet wurde, aber nun ein wichtiger Meilenstein sei, der die enorme Entwicklung der KI in den letzten zehn Jahren veranschaulicht. Altman gab jedoch an, dass ein Modell mit "Gold-Level-Fähigkeiten" erst in "vielen Monaten" für die Öffentlichkeit verfügbar sein werde. Diese Errungenschaft demonstriert, wie schnell sich die Technologie weiterentwickelt. Noch im letzten Jahr wurden KI-Modelle mit Grundschulmathematik evaluiert, sagte Brown. Tech-Milliardär Peter Thiel hatte im Vorjahr geschätzt, dass es mindestens noch drei Jahre dauern würde, bis KI die US Math Olympiad-Aufgaben lösen könnte. Trotz aller Begeisterung gibt es auch Skeptiker. Gary Marcus, ein bekannter Kritiker von KI-Hype, nannte die Leistung des Modells "wirklich beeindruckend" auf X, stellte aber einige Fragen zur Trainingsmethode, zum Umfang der "allgemeinen Intelligenz," zur Nutzen für die Allgemeinheit und zu den Kosten pro Problem. Marcus betonte auch, dass die IMO die Ergebnisse bisher nicht unabhängig verifiziert habe. Die KI-Community ist von diesem Durchbruch tief beeindruckt. Das Modell hat bewiesen, dass es in der Lage ist, komplexe mathematische Probleme zu lösen, die traditionell als sehr herausfordernd gelten. Dies kann die Entwicklung von allgemeiner KI signifikant vorantreiben und neue Anwendungsgebiete eröffnen. Die Fähigkeit, über längere Zeiträume hinweg kreatives Denken aufrechtzuerhalten, ist besonders bemerkenswert und könnte in Zukunft zu weiteren Innovationen führen. OpenAI wird weiterhin an der Verbesserung seiner Modelle arbeiten und sich um eine breitere Verfügbarkeit dieser Technologien bemühen.