HyperAI

AI-Agenten können Berater noch nicht ersetzen – aber das könnte sich bald ändern, sagt Brendan Foody, CEO von Mercor. Neue Forschungsergebnisse des Unternehmens zeigen, dass führende KI-Modelle bei komplexen, realen Aufgaben aus den Bereichen Beratung, Bankwesen und Recht bisher nur in weniger als 25 Prozent der Fälle erfolgreich waren, wenn sie nur einen Versuch hatten. Selbst bei acht Wiederholungen erreichten die Agenten nur eine Erfolgsquote von 40 Prozent. Besonders herausfordernd waren Management-Beratungsaufgaben, die auf Expertenwissen aus McKinsey, BCG, Deloitte, Accenture und EY basierten. Dabei lag die Leistung von OpenAI’s GPT 5.2 bei knapp 23 Prozent, während Anthropic’s Opus 4.6 mit fast 33 Prozent die beste Performance zeigte – ein deutlicher Fortschritt gegenüber der früheren Version von GPT 3, die nur 3 Prozent erreichte. Foody erwartet, dass die Erfolgsquote bis Ende des Jahres auf etwa 50 Prozent steigen könnte. Er betont, dass es sich um „einer der anspruchsvollsten Arbeitsbereiche der Wirtschaft“ handle, für den Unternehmen Millionen zahlen. Trotz der Fortschritte zeigen die Modelle erhebliche Schwächen bei langfristigen, mehrstufigen Aufgaben, da sie Schwierigkeiten haben, den richtigen Dateipfad zu finden oder mehrere Werkzeuge und Dokumente gleichzeitig zu verknüpfen. Sie verhalten sich oft wie junge Praktikanten: gut in Recherche und Datenanalyse, aber unzureichend in Planung und Kontextverstehen. Frank Jones, ehemaliger KPMG-Berater und aktueller Expertenvertragspartner bei Mercor, bestätigt, dass KI-Modelle zwar oft nahe an der Lösung sind, aber häufig menschliche Nachbearbeitung benötigen – besonders bei Begriffen wie „kundenfertig“, die für Menschen klar sind, für KI jedoch viel Nuance erfordern. Die Fortschritte sind laut Foody nicht auf bahnbrechende Innovationen angewiesen, sondern auf mehr und bessere Trainingssdaten, die die führenden Labore bereits massiv investieren. Mercor selbst, das mit Kunden wie OpenAI, Anthropic und Meta zusammenarbeitet, hat im Herbst eine Finanzierungsrunde abgeschlossen, die das Unternehmen auf 10 Milliarden Dollar bewertete. Mit über 30.000 globalen Vertragsarbeitern, die KI-Modelle durch Aufgaben wie Chatbot-Überarbeitung trainieren, stieg das Umsatzwachstum 2025 um 4.658 Prozent. Foody ist überzeugt, dass niedrigere Beratungsrollen besonders gefährdet sind. Der nächste Test der APEX-Agents-Benchmark wird nicht mehr einzelne Analysten, sondern ganze Beratungshäuser wie McKinsey bewerten – und könnte dort, so Foody, „eine sehr beunruhigende Botschaft“ vermitteln. In zwei Jahren, so seine Prognose, werden Chatbots so gut sein wie die besten Beratungsfirmen. In der Branche wird die Entwicklung mit Spannung verfolgt. Experten sehen in den Ergebnissen zwar noch eine klare menschliche Dominanz, aber auch eine unverkennbare Beschleunigung. Die KI wird nicht einfach die Arbeit ersetzen, sondern die Struktur der Beratungsbranche grundlegend verändern – von der Arbeitsweise bis zur Unternehmenskultur. Die Frage ist nicht mehr, ob, sondern wann die KI die Entscheidungsgewalt übernimmt.

Verwandte Links

Verwandte Links

Verwandte Links

Das Argonne National Laboratory in Den Vereinigten Staaten Hat CVEvolve Vorgeschlagen, Einen Zero-Code-Algorithmus Zur Selbstentdeckung Für Die Wissenschaftliche Bildverarbeitung, Der Über Umfassende Funktionen Verfügt, Darunter Codierung, Ergebnisselbstprüfung Und Strategieoptimierung.

Das Argonne National Laboratory in Den Vereinigten Staaten Hat CVEvolve Vorgeschlagen, Einen Zero-Code-Algorithmus Zur Selbstentdeckung Für Die Wissenschaftliche Bildverarbeitung, Der Über Umfassende Funktionen Verfügt, Darunter Codierung, Ergebnisselbstprüfung Und Strategieoptimierung.

Command Palette

AI-Agenten nähern sich Beratungsarbeit an – doch Menschen bleiben entscheidend

Verwandte Links

Command Palette

AI-Agenten nähern sich Beratungsarbeit an – doch Menschen bleiben entscheidend

Verwandte Links

Command Palette

AI-Agenten nähern sich Beratungsarbeit an – doch Menschen bleiben entscheidend

Verwandte Links

Das Argonne National Laboratory in Den Vereinigten Staaten Hat CVEvolve Vorgeschlagen, Einen Zero-Code-Algorithmus Zur Selbstentdeckung Für Die Wissenschaftliche Bildverarbeitung, Der Über Umfassende Funktionen Verfügt, Darunter Codierung, Ergebnisselbstprüfung Und Strategieoptimierung.

Das Argonne National Laboratory in Den Vereinigten Staaten Hat CVEvolve Vorgeschlagen, Einen Zero-Code-Algorithmus Zur Selbstentdeckung Für Die Wissenschaftliche Bildverarbeitung, Der Über Umfassende Funktionen Verfügt, Darunter Codierung, Ergebnisselbstprüfung Und Strategieoptimierung.