Quels autres secteurs peuvent tirer profit des graphes de connaissances de la santé ?
L’industrie de la santé est devenue pionnière dans l’utilisation des graphes de connaissances non pas grâce à une adoption précoce de nouvelles technologies, mais en investissant, sur plusieurs siècles, dans une compréhension partagée du réel. Longtemps avant l’ère du big data ou de l’intelligence artificielle, le domaine médical a établi des consensus fondamentaux : sur ce qui existe (ontologies), sur la manière de nommer les entités (vocabulaires contrôlés), sur la manière de produire des preuves (observations), sur l’interopérabilité des systèmes et sur l’application de normes via la régulation, la collaboration et le financement public. Ces fondations ont permis à la connaissance de s’accumuler, plutôt que de se fragmenter. D’autres secteurs peuvent tirer des enseignements de cette expérience. Leur potentiel à développer des graphes de connaissances est aujourd’hui tout aussi réel, bien que leur maturité soit encore inférieure. Ce qui différencie la santé, ce n’est pas la faisabilité, mais la coordination et la longévité des efforts. Premièrement, l’adoption d’ontologies partagées est essentielle. La santé dispose de milliers d’ontologies spécialisées (anatomie, génétique, molécules) via des répertoires comme BioPortal ou l’OBO Foundry. Elle utilise également des ontologies transversales comme Schema.org ou QUDT, construites selon des standards du W3C (OWL, SHACL, SKOS). Des ontologies supérieures comme BFO ou SUMO aident à structurer les concepts à un niveau abstrait. D’autres domaines suivent : l’Ontologie ELI en Europe, par exemple, standardise la représentation des textes législatifs ; ENVO modélise les environnements naturels ; FIBO dans la finance définit des concepts fondamentaux comme les contrats ou les instruments financiers. Ces exemples montrent que les ontologies peuvent émerger de collaborations communautaires, même sans autorité centrale. Deuxièmement, les vocabulaires contrôlés doivent être considérés comme une infrastructure, pas comme des outils ponctuels. En santé, des systèmes comme SNOMED CT, ICD-11, MedDRA ou RxNorm sont des ressources publiques, ouvertes et machine-lisibles. Des initiatives comme SPOKE ou le Monarch Initiative les intègrent dans des graphes de connaissances unifiés. D’autres secteurs peuvent faire de même : cataloguer les entreprises, les produits, les politiques publiques ou les composants techniques comme des données partagées, ouvertes et évolutives. Troisièmement, l’observation empirique doit guider la structure. La médecine repose sur des preuves reproductibles. Des standards comme CDISC standardisent la collecte des données cliniques, permettant une recherche cumulée. D’autres domaines adoptent des approches similaires : les données environnementales en climatologie, ou les rapports d’incidents en cybersécurité, peuvent bénéficier de modèles d’observation structurés. Quatrièmement, l’interopérabilité doit être standardisée, pas seulement le sens des données. HL7 FHIR, par exemple, définit précisément comment échanger des informations cliniques entre systèmes. Des secteurs comme la finance (ISO 20022), la construction (IFC), ou la gestion des risques (ISO 31000) développent des modèles similaires. Cinquièmement, la régulation peut imposer l’alignement sémantique. L’FDA exige l’utilisation de MedDRA ou de CDISC, forçant la cohérence. Dans la finance, les régulateurs comme la SEC ou FINRA imposent des normes, mais manquent encore d’un écosystème de vocabulaires partagés aussi mature. Sixièmement, les concepts fondamentaux doivent être séparés de la compétition. Les entreprises de santé rivalisent sur les traitements, pas sur la définition des maladies. Le Pistoia Alliance montre que les concurrents peuvent collaborer sur des standards pré-competitifs. Des initiatives similaires existent en cybersécurité (MITRE ATT&CK) ou dans l’industrie du logiciel. Septièmement, le financement public est crucial. L’NIH a joué un rôle central dans le développement des ontologies biomédicales. D’autres secteurs pourraient créer des fondations, des partenariats public-privé ou des consortiums pour financer des infrastructures sémantiques durables. Enfin, l’ancrage dans des standards ouverts garantit que la connaissance ne dépend pas d’un seul éditeur. Le W3C, via RDF, OWL ou SHACL, fournit les fondations d’un Web sémantique durable. En conclusion, la santé n’a pas réussi grâce à l’IA, mais parce qu’elle a externalisé la signification pendant des siècles. Les graphes de connaissances ne créent pas l’accord, mais ils le rendent calculable, réutilisable et évolutif. Les autres secteurs n’ont pas besoin de réinventer la roue, mais d’adopter ces principes : s’accorder sur ce qui existe, traiter les référentiels comme des biens publics, laisser les observations guider la structure, utiliser la régulation, financer collectivement, et s’ancrer dans des standards ouverts. Steve Hedden, responsable de produit chez TopQuadrant, spécialiste des graphes de connaissances et des technologies sémantiques, partage ces enseignements à travers son travail en gestion des données et son engagement auprès du W3C.
