HyperAIHyperAI

Command Palette

Search for a command to run...

Un Ingénieur expérimenté révèle ses véritables usages des grands modèles linguistiques : productivité, éthique et limites

Résumé du contenu : La Utilisation Prudente et Nuancée des Modèles de Langue Grandes (LLMs) par un Ingénieur Expérimenté Qui a été au centre de l'événement ? Christopher Krycho, un ingénieur expérimenté et senior data scientist chez BuzzFeed, a partagé sa réflexion personnelle sur l'utilisation des modèles de langue grandes (LLMs) dans les domaines professionnel et personnel. Bien que critique envers certaines facettes des LLMs, il reconnaît leur potentiel et élabore sur les méthodes efficaces pour maximiser leurs avantages. Contexte et Déroulement de l'Événement Krycho a codifié une déclaration d'éthique personnelle concernant son utilisation des LLMs, comme ChatGPT et Claude, développés par Anthropic. Il a acquis une expérience significative au fil des ans, passant de la recherche sur les réseaux neuronaux recurrents basés sur des caractères (char-rnns) à la fine-tuning de GPT-2 et aux expérimentations avec GPT-3 et ChatGPT. Malgré cette expertise, il utilise les LLMs beaucoup moins fréquemment qu'on pourrait le penser. Technique d'Interaction avec les LLMs Krycho s'appuie fortement sur l'ingénierie de l'invite (prompt engineering) et préfère accéder aux API des LLMs plutôt que de utiliser les interfaces frontales. Par exemple, il utilise souvent les API de Claude Sonnet d'Anthropic, car elles produisent desrésultats moins "mécaniques" et sont plus précises en matière de programmation. Les paramètres tels que la temperature (contrôlant la créativité du modèle) sont ajustés pour obtenir des résultats déterministes (0.0) ou légèrement variés (0.2 - 0.3). Utilisation Professionnelle des LLMs Krycho a utilisé les LLMs pour résoudre rapidement des problèmes au travail, notamment : - Etiquetage Hiérarchique : Génération rapide de labels hiérarchiques pour des catégories spécifiques. - Modélisation de Recommandation : Identification de contenus similaires pour créer des modèles de recommandation. - Écriture de Regex : Création de régular expressions complexes en quelques minutes. - Custom Callbacks : Génération de classes de callback personnalisées pour la surveillance des performances de modèles de machine learning. Ces projets, initialement simples, ont été élaborés avec une intervention humaine minimale. Toutefois, Krycho souligne l'importance de la vérification humaine, car les LLMs peuvent générer des sorties factuellement incorrectes (hallucinations). Utilisation des LLMs pour l'Écriture Contrairement à ce que l'on pourrait supposer, Krycho ne utilise pas les LLMs pour rédiger ses articles de blog. Il considère son style d'écriture trop unique et idiosyncratique pour être replicable par un modèle. De plus, il y a des préoccupations éthiques liées à la représentation inexacte de l'autorat. Une technique alternative qu'il a mise en place consiste à envoyer des versions presque terminées de ses articles aux LLMs, en leur demandant de simuler les commentaires d'un utilisateur pessimiste du forum Hacker News. Ceci aide à identifier les faiblesses de son argumentation sans le guider sur la façon de l'améliorer. Utilisation des LLMs pour le Codage Pour le codage, Krycho utilise les LLMs principalement pour des tâches ponctuelles où leur aide peut augmenter la productivité, comme la création de régular expressions ou de solutions de codage personnalisées. Il trouve les suggestions inline des assistants de codage comme GitHub Copilot distrayantes et peu utiles, car elles perturbent son flux de travail. Pour des questions de codage complexes, surtout impliquant des bibliothèques moins populaires, il est plus prudent de vérifier manuellement la génération de code des LLMs. Agents, MCP et Vibe Coding Krycho est sceptique face aux agents et à la modularité de contrôle (MCP), considérant qu'ils ne proposent pas de nouveaux cas d’usage révolutionnaires. Il voit la vibe coding, une approche où les modèles génèrent du code en continu et le vérifient, comme potentiellement risquée et imprévisible dans les coûts. Il admet qu'elle pourrait être utile pour des projets rapides et personnels mais estime que c'est irresponsable de l'utiliser pour des projets professionnels critiques. Évaluation de l’Événement par des Professionnels de l’Industrie Les opinions de Krycho sur l'utilisation des LLMs reflètent un sentiment de prudence et de nuance, souvent absent dans les débats publics actuels sur l'intelligence artificielle. Contrairement au critique AI Ed Zitron, qui pense que l'industrie des LLMs est condamnée à cause des coûts exorbitants, Krycho soutient que, même si les modèles génératifs présentent des défis économiques, ils ont des applications réelles et utiles. Si les grands fournisseurs comme OpenAI venaient à s'effondrer, des alternatives open-source comme Qwen et DeepSeek R1 pourraient prendre le relais, offrant des fonctionnalités comparables tout en étant plus rentables. Informations Supplémentaires : Profil de l’Entreprise et Avis Professionnels BuzzFeed est une entreprise de médias numériques connue pour son contenu viral et ses analyses de tendances. En tant que senior data scientist, Christopher Krycho se concentre sur l'analyse de grandes masses de données et le développement de solutions analytiques innovantes. Son expérience lui permet d’évaluer les LLMs de manière pragmatique, soulignant l'équilibre entre leur potentiel et leurs limites. Opinion Professionnelle : La réticence de Krycho à adopter les LLMs dans tous les domaines peut paraître conservatrice, mais elle est fondée sur des années d'expérimentation et d'évaluation. Les LLMs sont clairement un outil puissant, mais leur utilisation doit être mesurée et adaptée au contexte spécifique. La nuance et la prudence, selon lui, sont essentielles pour maintenir l’intégrité et l’efficacité des projets.

Liens associés

Un Ingénieur expérimenté révèle ses véritables usages des grands modèles linguistiques : productivité, éthique et limites | Articles tendance | HyperAI