OpenAI o3 besiegt Grok 4 im AI-Schachfinale mit 4:0
OpenAI’s o3-Modell hat in einem hochkarätigen AI-Schachwettbewerb, organisiert von Google’s Kaggle, Elon Musks Grok 4 mit 4:0 besiegt und sich somit den Titel des stärksten KI-Schachspielers unter den allgemeinen KI-Modellen gesichert. Der Wettbewerb fand vom 5. bis 7. August in einem K.O.-System mit acht großen Sprachmodellen statt, darunter OpenAI’s o3 und o4-mini, Google’s Gemini 2.5 Pro und Gemini 2.5 Flash, Anthropic’s Claude 4 Opus, DeepSeek’s DeepSeek R1 sowie Kimi’s k2. Grok 4 hatte sich bis ins Finale qualifiziert, wo es zunächst als klarer Favorit galt, nachdem es seine Vorrundengegner souverän besiegt hatte. Doch im Finale zeigte o3 eine beeindruckende Dominanz: In vier Partien spielte es präzise, strategisch tiefgründig und ohne nennenswerte Fehler. Grok 4 dagegen beging wiederholt gravierende Fehler, was die Analyse von Chess.com-Redakteur Pedro Pinhata als „unerkennbar“ beschrieb. Der ehemalige Weltmeister Magnus Carlsen kommentierte die Partie in einer Livestream-Übertragung mit scharfer Kritik: Er verglich Grok mit „dem einen Typen in der Bar, der nur Theorie kennt, aber sonst nichts“. Die Partie wurde als symbolischer Konflikt zwischen zwei AI-Strategien gesehen – zwischen OpenAIs Fokus auf tiefes, reflektierendes Denken und Musks Ansatz, der stärker auf Skalierung und schnelle Anpassung setzt. In der Platzierungsrunde gewann Google’s Gemini 2.5 Pro mit 3,5:0,5 gegen o4-mini und belegte den dritten Platz. Die Ergebnisse unterstreichen die fortschreitende Leistungssteigerung von o3, das nach der Einführung des „reasoning-tuned“-Ansatzes als besonders stark in komplexen, strategischen Aufgaben gilt. Obwohl OpenAI, xAI und Kaggle auf Anfrage nicht kommentierten, wird die Niederlage von Grok 4 als Rückschlag für Musks ambitionierte KI-Pläne gesehen. Die Auseinandersetzung zwischen Musk und Sam Altman, den beiden führenden Figuren der KI-Szene, hat sich in den vergangenen Monaten verschärft – von rechtlichen Androhungen gegen Apple bis hin zu publikumswirksamen Vergleichen über die „vertrauenswürdigste“ Führung in der KI-Zukunft. Die Schachpartie wurde damit nicht nur als technische Messung, sondern auch als Symbol für die wachsende Kluft zwischen den Visionen zweier KI-Imperien. Experten sehen in o3s Sieg eine Bestätigung für den Wert von tiefem, kontextuellen Denken in KI-Systemen – besonders in komplexen, langfristigen Strategien wie Schach. Gleichzeitig bleibt die Frage offen, ob solche Leistungen in der realen Welt, wo Unsicherheit und unerwartete Umstände dominieren, ebenso überzeugen können.