HyperAI

Un projet interne méconnu au sein d'Anthropic, baptisé « Marlin » et géré par la plateforme de données Snorkel AI, vise à optimiser l'outil de codage IA « Claude Code ». Pour améliorer la capacité de l'intelligence artificielle à générer du code de haute qualité, cette initiative s'appuie sur le travail manuel d'environ mille ingénieurs logiciels indépendants à travers le monde. Ce processus de formation fine vise à faire correspondre les réponses de l'IA aux standards attendus d'un développeur professionnel expérimenté. Les entreprises technologiques comme Anthropic sous-traitent fréquemment ces tâches de collecte de données à des intermédiaires spécialisés. Snorkel AI recrute des contractants dotés d'une expertise technique pointue, souvent titulaires d'un diplôme d'études supérieures ou disposant d'une expérience équivalente. Selon les témoignages d'ouvriers de cette industrie, ces missions rémunèrent jusqu'à 280 dollars par tâche, ce qui représente une heure de travail intense pour créer des scénarios de programmation complexes et évaluer les résultats du modèle. Des plateformes concurrentes comme Scale AI et Mercor offrent également des tarifs allant jusqu'à 110 dollars de l'heure pour des travaux similaires d'ingénierie logicielle. Le cœur du projet Marlin repose sur des tests comparatifs A/B. Les ingénieurs chargés de la tâche sont invités à sélectionner des répertoires sur GitHub et à simuler des demandes de modification, appelées « Pull Requests ». Ils formulent des instructions précises pour demander à l'IA de restructurer des systèmes, d'améliorer la sécurité ou d'optimiser la lisibilité du code sans en altérer le fonctionnement logique. L'IA génère alors deux versions distinctes de la solution. Le contractant, agissant comme un juge expert, compare ces deux sorties et choisit la plus efficace, la plus sécurisée ou la plus facile à maintenir. Les directives du projet exigent une rigueur absolue. Par exemple, une tâche spécifique portait sur la sécurisation d'une plateforme d'apprentissage automatique nommée MLFlow. L'objectif était de corriger une faille potentielle tout en conservant la légitimité des options de téléchargement autorisées. Les contractants devaient évaluer si le code produit était prêt pour une production réelle, en vérifiant sa correction, sa fiabilité et sa sécurité contre les intrusions de commandes. D'autres missions impliquaient de tester la capacité de l'IA à maintenir le contexte lors de conversations complexes ou de générer un code plus simplifié pour faciliter sa maintenance future. Cette évolution marque un tournant dans l'industrie de l'étiquetage des données. Alors que les tâches étaient autrefois générales, elles requièrent désormais des compétences spécialisées au niveau doctoral ou équivalent. Snorkel AI, fondé en 2019 par des chercheurs de l'Université Stanford, figure parmi les principaux partenaires d'Anthropic, de Google et de Mistral. Bien que l'entreprise ait levé 100 millions de dollars en mai 2025 et évaluée à 1,3 milliard de dollars, elle a également dû réduire sa force de travail de 13 % en septembre dernier, reflétant la volatilité du secteur. Les deux entreprises impliquées, Anthropic et Snorkel, n'ont pas fourni de commentaire officiel concernant les détails de ce projet. Cependant, les informations recueillies auprès des contractants montrent comment une armée invisible de spécialistes contribue à l'entraînement des systèmes d'intelligence artificielle les plus avancés. Ce travail humain est essentiel pour transformer les modèles de langage en outils de codage fiables, capables de rivaliser avec les meilleurs développeurs humains dans des environnements de production exigeants.

Liens associés

Liens associés

Liens associés

Tutoriel En Ligne | UC Berkeley/NVIDIA Et d'autres Publient Gsplat, Une Bibliothèque 3DGS open-source Qui Économise 4 Fois La Mémoire GPU Et Réduit Le Temps d'entraînement De 10%.

Tutoriel En Ligne | UC Berkeley/NVIDIA Et d'autres Publient Gsplat, Une Bibliothèque 3DGS open-source Qui Économise 4 Fois La Mémoire GPU Et Réduit Le Temps d'entraînement De 10%.

Command Palette

Claude Code accélère son développement interne

Liens associés

Command Palette

Claude Code accélère son développement interne

Liens associés

Command Palette

Claude Code accélère son développement interne

Liens associés

Tutoriel En Ligne | UC Berkeley/NVIDIA Et d'autres Publient Gsplat, Une Bibliothèque 3DGS open-source Qui Économise 4 Fois La Mémoire GPU Et Réduit Le Temps d'entraînement De 10%.

Tutoriel En Ligne | UC Berkeley/NVIDIA Et d'autres Publient Gsplat, Une Bibliothèque 3DGS open-source Qui Économise 4 Fois La Mémoire GPU Et Réduit Le Temps d'entraînement De 10%.