HyperAI

Le Cancer De L’ovaire Peut Être Identifié Grâce À Des Analyses De Sang, Des Analyses D’urine Et D’autres Indicateurs ! L'équipe De Liu Jihong De L'université Sun Yat-sen a Pris Les Devants Et Quatre Grandes Écoles De Médecine Ont Conjointement Construit Un Modèle De Fusion D'ia

特色图像

Selon les « Lignes directrices pour le diagnostic et le traitement du cancer de l'ovaire (édition 2022) » publiées par la Commission nationale de la santé, l'incidence annuelle du cancer de l'ovaire dans mon pays se classe au troisième rang parmi les tumeurs de l'appareil reproducteur féminin, juste derrière le cancer du col de l'utérus et les tumeurs malignes du corps utérin. Le taux de létalité est le premier parmi les tumeurs malignes de l'appareil reproducteur féminin, et son taux de survie à 5 ans est étroitement lié au stade de la maladie au moment du diagnostic. Selon les données publiées par l'Institut national du cancer des États-Unis, le taux de survie à 5 ans du cancer de l'ovaire au stade précoce de l'infection locale est de 92,41 TP3T, tandis que le taux de survie à 5 ans au stade métastatique tombe à 31,51 TP3T.

Les ovaires sont situés profondément dans la cavité pelvienne. Les lésions ovariennes aux premiers stades ne présentent souvent aucun symptôme clinique spécifique. Lorsque les symptômes apparaissent et que les patients consultent un médecin, les patients atteints de 70% sont déjà aux stades avancés. Par conséquent, le diagnostic précoce du cancer de l’ovaire est d’une grande importance.

Taux de survie à 5 ans du cancer de l'ovaire à différents stades

Récemment, l'équipe du professeur Liu Jihong du département de gynécologie du centre de prévention et de traitement du cancer de l'université Sun Yat-sen, en collaboration avec l'université de médecine du Sud, l'hôpital Tongji affilié au collège médical Tongji de l'université des sciences et technologies de Huazhong et l'hôpital d'obstétrique et de gynécologie affilié à la faculté de médecine de l'université du Zhejiang, a mené une étude pour répondre aux difficultés actuelles du diagnostic précoce du cancer de l'ovaire et au manque de marqueurs tumoraux efficaces.Un modèle de fusion d'intelligence artificielle MCF pour le diagnostic du cancer de l'ovaire a été construit, et le risque de cancer de l'ovaire peut être calculé en saisissant des données de tests de laboratoire de routine et l'âge.Les résultats pertinents ont été publiés dans The Lancet Digital Health.

Adresse du document :
https://doi.org/10.1016/S2589-7500(23)00245-500245-5/fulltext#%20)
Suivez le compte officiel et répondez « cancer de l'ovaire » pour obtenir l'article complet

Points saillants de la recherche :

* L'étude a recueilli des données auprès de trois hôpitaux de mon pays et a utilisé un cadre de fusion de classification décisionnelle multicritère (MCF) pour développer le modèle

* Le modèle est plus précis dans l'identification du cancer de l'ovaire que les biomarqueurs traditionnels tels que CA125 et HE4

* Une étude démontre le potentiel d'un test de laboratoire de routine, peu coûteux et facilement accessible, comme outil de diagnostic efficace pour le cancer de l'ovaire

Réunissant 3 hôpitaux, 10 000 patients, 98 examens et données associés

Les chercheurs ont collecté des données auprès du Centre de cancérologie de l'Université Sun Yat-sen, de l'hôpital Tongji affilié au Collège médical Tongji de l'Université des sciences et technologies de Huazhong et de l'hôpital d'obstétrique et de gynécologie affilié à la Faculté de médecine de l'Université du Zhejiang entre le 1er janvier 2012 et le 4 avril 2021.Données sur 98 tests de laboratoire et caractéristiques cliniques de plus de 10 000 patientes (femmes atteintes d'un cancer de l'ovaire et de lésions annexielles utérines bénignes/examen physique normal).

Parmi eux, les données des participants du Tongji Medical College de l'Université des sciences et technologies de Huazhong (3 007 personnes au total) ont été sélectionnées comme ensemble de formation, et une validation croisée quintuple a été effectuée sur cet ensemble de formation. Les deux ensembles de validation externes provenaient de l'hôpital pour femmes de la faculté de médecine de l'université du Zhejiang (5 641 sujets) et du centre de cancérologie de l'université Sun Yat-sen (2 344 sujets).

MCF : Fusion de 20 modèles de classification de base

Organigramme de recherche

L’étude a recruté un grand nombre de participants provenant de 3 régions différentes de notre pays. L’âge médian au moment du diagnostic du cancer de l’ovaire dans les 3 cohortes était de 51 à 56 ans. Cependant, les données à grande échelle posent également certains problèmes. Par exemple, les données multicentriques sont hétérogènes, ce qui n’est pas propice à la construction de modèles d’IA robustes, et présentent plusieurs défauts, notamment un déséquilibre important entre le nombre de patientes atteintes d’un cancer de l’ovaire et de participants témoins, des unités incohérentes et un grand nombre de valeurs manquantes (48,5% dans l’ensemble de validation interne).

Afin de répondre à ces problèmes de données et d’assurer la robustesse du modèle,Les chercheurs ont effectué un travail important de nettoyage des données.inclure:

* Lors de la construction du modèle, 98 éléments de test de laboratoire ont été répertoriés comme fonctionnalités d'entrée candidates. Les différents éléments de test de laboratoire de chaque unité ont été traités de manière uniforme par l’unité.

* Les données manquantes ont été imputées à l'aide de l'algorithme MICE (imputation multivariée par équations en chaîne).

* Afin de réduire les différences dans la distribution des données entre les institutions, l’algorithme Box-Cox a été utilisé pour rapprocher les données, puis les données ont été normalisées par standardisation min-max.

* Afin de résoudre le problème du déséquilibre des données, une méthode d’échantillonnage adaptatif complet est utilisée avec un ratio d’équilibrage de 0,5.

De plus, le cadre MCF est une variante du H-MCF (Hierarchical Prediction Scheme Based on MCF) proposé par l'équipe de recherche dans des travaux précédents.Les chercheurs ont établi 176 modèles de classification de base et ont combiné la méthode de sélection des caractéristiques avec le classificateur d’apprentissage automatique. Grâce à une validation croisée en cinq étapes, ils ont sélectionné les 20 meilleurs modèles de classification de base parmi les 176 modèles.Parmi eux, le processus de sélection des fonctionnalités identifiera les 20 fonctionnalités les plus importantes que le classificateur utilisera pour générer un modèle de classification de base.

Les chercheurs ont ensuite estimé le poids de chaque modèle sur la base d’une théorie de prise de décision multicritère et ont finalement fusionné leurs prédictions pour parvenir à une classification cohérente.

Top 20 des modèles de classification de base

Les performances du modèle sont nettement supérieures à celles des méthodes traditionnelles

Les chercheurs ont quantifié la précision de prédiction du modèle MCF en utilisant l'ASC, la précision, la spécificité, la sensibilité, la valeur prédictive positive, la valeur prédictive négative et le score F1. Les résultats sont présentés dans la figure ci-dessous :

Les chercheurs ont sélectionné 52 caractéristiques (51 indicateurs de tests de laboratoire et l'âge) parmi les 20 principaux modèles de classification de base, dont environ 901 caractéristiques TP3T étaient significativement associées au risque de cancer de l'ovaire, et ont construit un classement similaire et cohérent des caractéristiques basé sur SHAP (Shapley Additiveexplanation, une technique d'évaluation et d'explication des prédictions du modèle). Les AUC prédictives des caractéristiques individuelles variaient de 0,477 (AFP) à 0,886 (CA125) et étaient généralement cohérentes avec leurs classements.

dans,51 indicateurs de tests de laboratoire comprennent des analyses sanguines de routine, des analyses d'urine, des tests biochimiques, etc.Par exemple, les plaquettes PLT, la mesure du fibrinogène FIB, la CRP qui est un indicateur pour évaluer le degré d'inflammation, l'ALB qui mesure les niveaux d'albumine sérique, la vitesse de sédimentation des érythrocytes ESR, la valeur du pH urinaire, etc. La figure A ci-dessous montre le classement par importance des indicateurs de test.

Classement des fonctionnalités et analyse de corrélation

Les ASC du MCF sur l'ensemble de validation interne et sur deux ensembles de validation externes indépendants étaient respectivement de 0,949 (95%CI 0,948-0,950), 0,882 (0,880-0,885) et 0,884 (0,882-0,887).

Les chercheurs ont également comparé le MCF avec les marqueurs tumoraux traditionnels dans la détection du cancer de l’ovaire.Pour les trois ensembles de validation permettant de distinguer le cancer de l’ovaire, l’ASC, la sensibilité et le score F1 du MCF étaient supérieurs à ceux des marqueurs tumoraux traditionnels.Comme le montre la figure suivante :

Pour la classification du cancer de l’ovaire avancé et des groupes témoins, l’ASC du MCF dans l’ensemble de validation interne était de 0,985 ; il a atteint 0,972 dans le premier ensemble de validation externe et 0,943 dans le deuxième ensemble de validation externe. Pour la classification du cancer de l'ovaire précoce par rapport aux témoins, l'ASC du MCF était de 0,879 dans l'ensemble de validation interne, de 0,823 dans les premier et deuxième ensembles de validation externe et de 0,810, respectivement.

Les résultats ont montréL'ASC et la sensibilité du modèle MCF pour identifier les patientes atteintes d'un cancer de l'ovaire, en particulier celles atteintes d'un cancer de l'ovaire à un stade précoce, étaient significativement plus élevées que celles des marqueurs traditionnels du cancer de l'ovaire CA125, HE4 et leur combinaison.De plus, le risque de cancer de l’ovaire peut toujours être prédit avec précision dans une population où certains indicateurs manquent, ce qui montre que le modèle MCF présente une bonne stabilité et une bonne compatibilité avec les données du monde réel.

En outre, cette étude a également révélé qu'en plus des marqueurs tumoraux, d'autres tests de laboratoire de routine, tels que le dimère DD et la numération plaquettaire, apportaient également une contribution significative au diagnostic et à la prédiction du cancer de l'ovaire, suggérant que les processus physiopathologiques liés à ces indicateurs de test peuvent jouer un rôle important dans le développement du cancer de l'ovaire, et leurs mécanismes potentiels méritent d'être explorés plus en détail.

L'IA favorise le développement des soins de santé primaires

Selon le « Bulletin statistique sur le développement du secteur des soins de santé de mon pays en 2022 », bien qu'il existe 979 768 établissements médicaux et de santé primaires dans mon pays, représentant 94 851 TP3T du nombre total d'établissements médicaux et de santé du pays, en termes de nombre de diagnostics et de traitements, le nombre de diagnostics et de traitements dans les établissements médicaux et de santé primaires est de 4,27 milliards, ce qui ne représente que 50,71 TP3T du nombre total de diagnostics et de traitements pour l'ensemble de l'année. On constate que le nombre d’établissements médicaux et de santé primaires dans mon pays représente une proportion élevée, mais le nombre de diagnostics et de traitements a encore beaucoup à faire.

En outre, selon les statistiques du Centre national du cancer, sur le marché des services médicaux contre le cancer de mon pays, les hôpitaux tertiaires publics ont entrepris plus de 801 tâches de traitement du cancer TP3T. La plupart de ces hôpitaux de catégorie A sont situés dans les capitales provinciales, mais ils doivent recevoir des patients de partout en même temps. On peut imaginer la pression exercée sur les médecins.

Cependant, l’application mature de l’intelligence artificielle au cours des dernières années a apporté une imagination sans fin au secteur médical et a fourni de nouvelles idées pour les soins primaires. Le modèle de diagnostic du cancer de l’ovaire MCF construit dans cette étude a été ouvert. La valeur du risque de cancer de l'ovaire peut être calculée en saisissant les données de test de laboratoire correspondantes et l'âge, ce qui fournit sans aucun doute un soutien important à la popularisation de ce modèle dans les institutions médicales primaires.

Le déploiement du diagnostic assisté par l’IA dans les établissements de soins de santé primaires est extrêmement important. Les « Avis sur l'approfondissement des réformes visant à promouvoir le développement sain des systèmes médicaux et de santé ruraux » publiés précédemment par le Conseil des affaires d'État mentionnaient également la nécessité d'accélérer le déploiement et l'application du diagnostic assisté par l'IA dans les établissements médicaux et de santé ruraux.

L’application de l’intelligence artificielle dans les institutions de santé primaires peut non seulement traiter les informations médicales en données structurées, résoudre les problèmes d’« îlots de données » et de qualité des données, et jeter les bases de l’interconnexion et du partage des informations médicales dans la région ; il peut également améliorer le niveau de diagnostic et de traitement primaires grâce à la consultation auxiliaire, au diagnostic auxiliaire, à la gestion des maladies chroniques et à d'autres fonctions, réduire la probabilité de diagnostic manqué et de diagnostic erroné, et permettre à davantage d'endroits de bénéficier d'un diagnostic et d'un traitement de haute qualité.

Références :

1.https://www.sysu.edu.cn/news/info/2331/1091611.htm