HyperAI
Back to Headlines

5 Conseils Pour Construire des Modèles Fondamentaux en IA : Leçons de l’Ordnance Survey

il y a 4 jours

5 Conseils pour Créer des Modèles Fondamentaux pour l'IA Dans un environnement où de nombreuses entreprises commencent seulement à se familiariser avec l'impact de l'intelligence artificielle, certaines ont déjà tiré profit de l'apprentissage automatique (ML) et d'autres technologies émergentes depuis plus d'une décennie. Parmi celles-ci, Ordnance Survey (OS), le service national de cartographie britannique, s'est distingué en intégrant ses expériences en IA et ML aux récents progrès en IA générative. Son objectif : raffiner, distribuer et appliquer ses vastes données géospatiales. Le CTO de OS, Manish Jethwa, partage cinq leçons clés pour les dirigeants d'entreprises souhaitant développer des modèles fondamentaux pour leur IA. 1. Développer une forte utilité pratique Ordnance Survey développe des modèles fondamentaux pour extraire des caractéristiques environnementales de manière sensible au droit d'auteur. Comme l'explique Jethwa, de nombreux grands modèles pré-entraînés par des organisations technologiques reposent sur des données commerciales, ce qui peut limiter leur utilité en cas de contraintes légales. "Nous construisons nos modèles fondamentaux à partir de zéro", déclare Jethwa. "Nous définissons l'ensemble d'entraînement complet avec nos propres données étiquetées internes." Ces modèles fondamentaux peuvent ensuite servir de base pour d'autres analyses, comme l'étude des matériaux de toits, des espaces verts ou de la biodiversité. Ce processus permet d'économiser du temps et des ressources, car il ne nécessite que de l'ajustement fin plutôt qu'un entraînement séparé pour chaque tâche. "Le modèle fondamental nous aide à construire des sorties ultérieures sans avoir à reprendre l'entraînement complet pour chaque problème spécifique", indique Jethwa. 2. Établir des méthodes intentionnelles L'entraînement des modèles demande des ressources considérables, mais Jethwa souligne que l'enjeu est de le faire de manière intentionnelle pour contrôler les coûts. "Nous devons être vigilants lors de l'entraînement de ces modèles, car il est facile de gaspiller beaucoup de cycles et d'énergie", explique-t-il. OS introduit les données d'entraînement par tranches, ce qui permet une adaptation progressive. "D'abord, nous construisons un petit modèle avec quelques centaines d'exemples, puis nous augmentons progressivement notre ensemble de données étiquetées", détaille Jethwa. "Aujourd'hui, nous sommes déjà à plusieurs centaines de milliers d'exemples, même si la plupart des modèles sont entraînés avec des millions de données." Malgré leur taille plus petite, ces modèles surpassent souvent ceux proposés par les grands fournisseurs, car ils sont spécialement adaptés à leur domaine d'activité. 3. Utiliser d'autres modèles LLM pour l'ajustement fin Bien que OS utilise des modèles fondamentaux internes, l'organisation n'ignore pas les grands modèles de langage (LLM) bien connus. Elle s'appuie sur ceux-ci pour effectuer des ajustements fins basés sur sa documentation interne. "Nous explorons également des partenariats avec des organisations externes comme IBM pour créer des solutions collaboratives face aux défis liés aux données", ajoute Jethwa. OS utilise principalement Azure Machine Learning et des outils basés sur Python, mais elle reste ouverte à d'autres capacités spécialisées. Cette approche vise à optimiser les ressources et à éviter toute activité stérile. "C'est une façon de rationaliser. Nous construisons lentement mais sûrement pour garantir que notre destination est atteignable et qu'on ne gaspille pas les ressources", conclut Jethwa. 4. Réfléchir à lacommercialisation La commercialisation des technologies développées par OS est un enjeu majeur. L'une des principales difficultés réside dans le droit d'auteur de la Couronne (Crown copyright) qui protège les actifs créés par les employés du secteur public britannique. "Il y aura probablement des opportunités pour partager ces modèles, mais il faut être prudent sur l'impact potentiel de cette commercialisation externe", précise Jethwa. OS cherche à protéger ses données tout en offrant le maximum de valeur aux contribuables britanniques. "Il est crucial de maintenir un équilibre : il ne faut pas que nos actifs soient collectés et monétisés sans apporter de bénéfices réels au public britannique", explique Jethwa. 5. Garder un œil sur l'avenir Les travaux d'OS sur les modèles fondamentaux ont démontré les avantages de l'IA générative pour faciliter l'accès aux Insights profonds. "Il s'est avéré essentiel pour permettre des interactions fluides, des accès rapides aux données et des raffinements efficaces des requêtes", note Jethwa. Il imagine un interface futuriste où un utilisateur pourrait dire : "Je suis intéressé par cette zone", zoomer dessus et l'IA demanderait : "Quoi de spécifique voulez-vous trouver ?". Si l'utilisateur répond "des écoles", l'IA pourrait alors préciser : "Quels types d'écoles ?" et engager une dialogue interactif. "L'IA doit être capable de transformer une requête en une réponse précise en consultant des sources autorisées, comme les informations d'OS combinées avec des données externes", insiste Jethwa. Cette vision future implique une intégration fluide des APIs et des données pour fournir des réponses définies et fiables. Évaluation et Profil de l'Entreprise Manish Jethwa, le CTO d'Ordnance Survey, met en lumière comment une organisation publique avec une histoire de collecte précise de données peut tirer parti des avancées en IA pour innover et offrir des services de qualité. OS, en tant que service national de cartographie, démontre l'importance de l'adaptabilité et de l'efficacité des modèles fondamentaux. L'approche de Jethwa, qui allie une gestion rigoureuse des coûts et un respect scrupuleux des lois sur le droit d'auteur, offre un modèle à suivre pour les entreprises souhaitant exploiter l'IA de manière responsable et bénéfique. L'industrie technologique reconnaît la pertinence de cette stratégie, qui combine innovation et prudence. Les entreprises peuvent s'inspirer de l'expérience d'OS pour développer leurs propres modèles fondamentaux, en veillant à aligner leurs efforts sur des cas d'utilisation clairs et en utilisant des méthodes intentionnelles pour contrôler les coûts. Cela permet d'optimiser les ressources et de ** maximiser la valeur** ajoutée, tout en gardant un regard tourné vers l'avenir.

Related Links