HyperAIHyperAI

Command Palette

Search for a command to run...

Junge Gründer revolutionieren AI-Datenindustrie

Brendan Foody, nun 22 Jahre alt, gründete 2023 gemeinsam mit zwei Highschool-Freunden Mercor – zunächst als automatisierte Personalvermittlung für Startups, die Softwareentwickler im Ausland einstellen wollten. Mit KI-gestützter Bewerbungsanalyse und automatisierten Vorstellungsgesprächen erreichte das Unternehmen bereits innerhalb weniger Monate jährliche Einnahmen von 1 Million US-Dollar und erzielte Gewinn. Im Frühjahr 2024 erhielt Mercor einen entscheidenden Auftrag: Scale AI, damals ein führender Anbieter von AI-Trainingsdaten, bat um 1.200 Softwareentwickler, um die neuen KI-Modelle von OpenAI und Anthropic im Codieren zu trainieren. Als die entlohnten Entwickler über verspätete Zahlungen klagten – Scale steht unter Rechtsstreit wegen Lohnverstößen – entschied sich Foody, den Mittelsmann zu umgehen. Mit der Gründung eines direkten, qualitativ hochwertigen Expertennetzwerks, das spezialisierte Softwareingenieure, Finanzexperten und andere Fachkräfte rekrutiert, stieg Mercor rasant. Im September 2024 kündigte Foody 500 Millionen US-Dollar jährliche Umsätze an – der schnellste Wachstumsschub in der Unternehmensgeschichte, womit Mercor die ehemalige Spitze von Anysphere (Cursor) übertraf. Die jüngste Finanzrunde bewertete das Unternehmen auf 10 Milliarden US-Dollar, wodurch Foody und seine Mitgründer zu den jüngsten selbstgemachten Milliardären wurden. Dieser Erfolg spiegelt eine tiefgreifende Verlagerung im AI-Ökosystem wider: Während die Aufmerksamkeit auf Rechenzentren und Chips fokussiert ist, entsteht ein parallel laufender Wettlauf um hochwertige Trainingsdaten. Die großen Labore haben die einfach zugänglichen Daten erschöpft und setzen nun auf spezialisierte, expertenbasierte Datensätze – besonders in Bereichen wie Programmierung, Finanzen und Recht. Diese Daten werden nicht mehr einfach gesammelt, sondern durch detaillierte „Bewertungsrubriken“ strukturiert, die jedes Detail eines Arbeitsablaufs abbilden. Ein Beispiel: Für eine medizinische Empfehlung muss ein Modell nicht nur den Puls prüfen, sondern auch eine Defibrillatoreinsatzanweisung geben, CPR durchführen und 16 weitere Schritte erfüllen. Solche Rubriken sind extrem aufwändig – oft erfordern sie zehn Stunden Arbeit pro Dokument – und werden von Unternehmen wie Mercor, Surge AI und Handshake bereitgestellt. Surge AI, gegründet von Edwin Chen, einem ehemaligen Datenwissenschaftler bei Google und Facebook, hat sich durch hochqualitative Rekrutierung und bessere Bezahlung (ca. 30 US-Dollar pro Stunde) abgehoben, obwohl auch es in Kalifornien wegen Fehlzuordnung von Arbeitnehmern verklagt wird. Mit über 1 Milliarde US-Dollar Umsatz im Vorjahr und einer geplanten Finanzierungsrunde im Wert von 1 Milliarde US-Dollar bei einer Bewertung von 15 Milliarden US-Dollar ist Surge ein Rival in der neuen Daten-Industrie. Andere Unternehmen wie Handshake, Labelbox, Turing und Micro1 folgen dem Trend, ihre bestehenden Netzwerke in AI-Trainingsdienstleistungen umzustellen. Handshake, ursprünglich eine Karrierenetzwerk-Plattform, stieg in nur fünf Monaten von drei auf 150 Mitarbeiter, erreichte eine Umsatzrate von 150 Millionen US-Dollar und wächst rasant. Die Nachfrage ist so groß, dass selbst Uber in die Branche einsteigt, indem es eine belgische Datenspezialistin kauft, um Fahrer für Annotationen zu nutzen. Gleichzeitig wächst der Wettbewerb – CEOs attackieren sich gegenseitig, bezeichnen Rivalen als „Körperwerkstätten“ oder „veraltete Crowdsourcing-Plattformen“. Scale, nach dem Eintritt von Meta in die Geschäftsbeziehung, verliert Kunden, bleibt aber wachsend: Laut internen Angaben wuchs der Datenumsatz monatlich, und der Umsatz im öffentlichen Sektor erreichte 2025 sein bestes Quartal seit 2020. Die Firma erweitert sich in die Evaluation von KI-Modellen, die Labore nutzen, um Schwächen zu identifizieren – und anschließend spezifische Daten zu kaufen. Die derzeitige Entwicklung zeigt, dass KI-Entwicklung nicht zu einer allgemeinen Intelligenz führt, die von sich aus generalisiert, sondern vielmehr von einer wachsenden Abhängigkeit von menschlichem, spezifischem Wissen abhängt. Wie Daniel Kang von der University of Illinois betont: Je mehr Leistung, desto mehr spezifische Daten. Die Hoffnung auf Superintelligenz, die „jeden Job“ erledigen kann, kollidiert mit der Realität, dass KI-Modelle ständig neu trainiert werden müssen – für jedes neue Szenario, jedes neue Unternehmen, jede neue Branche. In diesem Szenario wird die Datenindustrie nicht weniger, sondern zentraler. „Die gesamte Wirtschaft wird zu einem Reinforcement-Learning-Umfeld“, sagt Foody. Die Datenanbieter sind die neuen Pioniere des AI-Booms – nicht die Modelle, sondern die, die sie bilden. Und während die Labore noch von der Vision einer allgemeinen KI träumen, haben die Datenunternehmen bereits die erste Gewinnquelle im AI-Ökosystem entdeckt.

Verwandte Links