Datenlabel-Unternehmen sind out – AI-Training erfordert jetzt Expertenwissen
Der CEO von Turing, Jonathan Siddharth, geht in einem Gespräch im „20VC“-Podcast davon aus, dass die Ära der klassischen Datenlabel-Unternehmen vorbei ist. Laut Siddharth reichen einfache Annotationen – wie das Markieren von Bildern oder Kategorisieren von Texten – nicht mehr aus, um moderne KI-Modelle zu trainieren. Stattdessen benötigen fortschrittliche Systeme, wie agente Modelle oder Architekturen mit Verstärkendem Lernen (Reinforcement Learning), komplexere, realitätsnahe Daten. Diese sollen das tatsächliche Wissensarbeiten von Menschen abbilden, etwa in Branchen wie Medizin, Recht oder Ingenieurwesen. Siddharth betont, dass KI-Labore heute nicht mehr nur Dienstleister suchen, sondern „proaktive Forschungspartner“, die in der Lage sind, innovative Trainingsumgebungen zu entwickeln. Dazu gehören simulierten Mini-Welten, die menschliche Arbeitsabläufe nachahmen. Dafür müssten AI-Training-Firmen nicht nur Daten, sondern auch Fachexperten aus verschiedenen Disziplinen einbinden. Turing selbst hat im Juni eine Series-E-Finanzierungsrunde von 111 Millionen US-Dollar abgeschlossen und erreichte eine Bewertung von 2,2 Milliarden Dollar. Der Jahresumsatz lag 2024 bei 300 Millionen Dollar – ein Anstieg um fast 200 Prozent gegenüber dem Vorjahr. Die Nachfrage nach KI-Training hat in den letzten Jahren zu einem Boom von Datenlabel-Startups geführt. Im Juni erwarb Meta eine 49-Prozent-Mehrheit an Scale AI, was das Unternehmen auf über 29 Milliarden Dollar bewertete. Im Oktober wurde Mercor mit einer Bewertung von 10 Milliarden Dollar erwähnt. Parallel dazu wuchs die Zahl von Freelancern, die für KI-Training arbeiten. Laut einem Bericht von Business Insider verdienen einige von ihnen monatlich Tausende Dollar, doch die Arbeit ist oft belastend und unvorhersehbar. Zudem hat sich ein schwarzer Markt entwickelt: Mehr als 100 Facebook-Gruppen wurden entdeckt, die illegale Zugänge zu Contractor-Accounts verkaufen – obwohl dies von den Plattformen strikt untersagt ist. Diese Entwicklung zeigt, wie stark die Nachfrage nach KI-Training ist, aber auch die Risiken, die mit unregulierter und unethischer Nutzung verbunden sind. Industrieexperten sehen in Siddharths Aussage eine klare Trendwende: Die Branche wandelt sich von reinem Daten-„Handling“ hin zu hochspezialisiertem, forschungsorientiertem KI-Training. Unternehmen, die nur einfache Annotationen anbieten, werden zunehmend ausgeschlossen. Erfolg verspricht nur noch, wer in der Lage ist, menschliche Expertise in künstliche Lernprozesse zu integrieren. Turing positioniert sich damit als Vorreiter in dieser neuen Ära – nicht mehr als Datenlabeler, sondern als Forschungs- und Entwicklungspartner für die nächste Generation von KI.
