HyperAI
Back to Headlines

DeepMind und OpenAI erreichen Goldniveau in Mathematik.

vor 10 Tagen

Kürzlich erreichten KI-Modelle von DeepMind und OpenAI bei der Internationalen Mathematik-Olympiade (IMO) Goldmedaillen-Niveaus. DeepMind gab am 21. Juli bekannt, dass sein System schwierige mathematische Probleme gelöst hatte, die bislang nur von den besten High-School-Studenten der Welt gelöst werden konnten. Zwar lag die Leistung im Vergleich zum Vorjahr nur geringfügig über dem Silbermedaillen-Niveau, doch der Erfolg dieses Jahr war besonders, da die KI-Modelle nun vollständig in natürlicher Sprache arbeiteten, ohne dass menschliche Experten bei der Übersetzung von Problemen oder Lösungen eingreifen mussten. Dies stellte einen „großen Paradigmenwechsel“ dar, sagte Thang Luong, ein Computerwissenschaftler bei DeepMind. Zuvor hatte DeepMind seine Erfolge mit spezialisierten KI-Tools wie AlphaGeometry und AlphaProof erzielt, die auf logischen Beweisprozessen basierten. Diese Systeme benötigten jedoch manuelle Übersetzungen der Probleme in eine Programmiersprache und die Rückübersetzung der Lösungen in natürliche Sprache. Dieses Jahr setzte das Unternehmen auf DeepThink, ein großes Sprachmodell, das auf dem Gemini-System basiert und speziell für mathematische Argumente optimiert wurde. Es konnte 35 von 42 Punkten bei den Olympiade-Aufgaben erzielen, wobei die Lösungen von denselben Richtern bewertet wurden wie die der menschlichen Teilnehmer. Gleichzeitig erreichte auch ein Modell von OpenAI, dem Entwickler von ChatGPT, bei den gleichen Aufgaben Goldmedaillen-Niveau. Allerdings wurden die Lösungen von OpenAI unabhängig bewertet. Die Leistung der KI-Systeme zeigt, dass sie in der Lage sind, komplexe mathematische Probleme zu lösen, die traditionell als sehr anspruchsvoll gelten. Bis 2012 dominierte in der KI-Forschung die Methode, die logischen Regeln manuell in die Systeme zu codieren. Danach erzielten neuronale Netze, die sich durch Datenlernalgorithmen selbst optimieren, zahlreiche Fortschritte. Tools wie ChatGPT sind heute weit verbreitet. Gary Marcus, ein Neurowissenschaftler von der New York University, bezeichnete die Ergebnisse von DeepMind und OpenAI als „sehr beeindruckend“. Er ist ein Befürworter der manuellen Codierung von Logik, auch bekannt als neurosymbolische KI, und kritisiert oft die übermäßige Aufregung um große Sprachmodelle. Dennoch lobte er die Fähigkeit, mathematische Probleme auf der Ebene der besten High-School-Studenten zu lösen. Ob LLMs langfristig die führende Technologie für mathematische Problemlösungen bleiben oder neurosymbolische KI wieder an Bedeutung gewinnt, ist noch unklar. Thang Luong betonte, dass beide Ansätze weiterentwickelt werden und sich möglicherweise verbinden könnten. Die Fortschritte von DeepThink und OpenAI-Modellen unterstreichen die steigende Leistungsfähigkeit von KI in mathematischen Bereichen und könnten den Weg für zukünftige Anwendungen in der Wissenschaft und Technologie ebnen.

Related Links