Le Taux De Précision a Atteint 97%. La Nouvelle Réussite De L'équipe Australienne Repose Sur L'apprentissage Profond Pour Identifier Le Sexe Par Tomodensitométrie Du Crâne, Surpassant Ainsi Les Médecins Légistes Humains.

Ces dernières années, avec le succès de plusieurs séries télévisées à suspense et à thème policier, un sujet mystérieux a également été porté à l'attention du public : la médecine légale. En termes simples, la médecine légale est comme Sherlock Holmes se cachant dans l’obscurité à la recherche de la vérité. Grâce à ses connaissances professionnelles et à sa technologie de pointe, il peut identifier les os et remonter jusqu'à eux en interprétant les témoignages silencieux dans les restes et les preuves physiques, et fournir des indications pour résoudre d'innombrables cas difficiles. Il s’agit d’une base solide pour garantir la justice judiciaire, et son importance est évidente.
Parmi les nombreux domaines de recherche de la médecine légale,L’identification du sexe des restes est une étape extrêmement importante.Face à un tas d’ossements, les méthodes précédentes s’appuyaient principalement sur des scientifiques médico-légaux expérimentés pour tirer des conclusions et des évaluations basées sur des normes publiées. Cependant, ces méthodes sont généralement influencées par des facteurs subjectifs, qui conduisent inévitablement à des écarts dans les résultats. Aujourd’hui, alors que les ordinateurs et les technologies d’apprentissage profond sont populaires, la manière d’utiliser la science pour résoudre l’impact des préjugés humains est devenue un nouveau sujet.
Récemment, une équipe de l'Université d'Australie occidentale, de l'Université de Nouvelle-Galles du Sud et de l'Université Hasanuddin en Indonésie,Un cadre automatisé basé sur l’apprentissage profond est proposé pour améliorer la précision du jugement de genre et réduire l’impact des biais cognitifs.
L’étude a utilisé 200 scanners crâniens provenant d’un hôpital indonésien pour former et tester trois configurations de réseau basées sur l’apprentissage profond. Le cadre d’apprentissage profond le plus précis a pu combiner les caractéristiques du genre et du crâne pour le jugement.La précision de classification peut atteindre 97%, ce qui est nettement supérieur aux 82% des observateurs humains.Cette expérience confirme le potentiel des cadres d’apprentissage profond pour des applications profondes en anthropologie médico-légale.
Les résultats de recherche pertinents ont été publiés dans la revue universitaire Scientific Reports sous le titre « Deep learning versus human assessors: forensic sex estimation from three-dimensional computed tomography scans ».

Adresse du document :
https://www.nature.com/articles/s41598-024-81718-y
Le projet open source « awesome-ai4s » rassemble plus de 200 interprétations d'articles AI4S et fournit des ensembles de données et des outils massifs :
https://github.com/hyperai/awesome-ai4s
Aller plus loin pour rendre l'IA « fiable et utilisable »
En anthropologie médico-légale, la structure squelettique cache de nombreuses différences dans les caractéristiques sexuelles, en particulier au niveau du crâne.La méthode de sexage morphologique du crâne la plus populaire dans la pratique médico-légale moderne est celle des cinq caractéristiques de dimorphisme du crâne proposées par Phillip L. Walker (ci-après dénommées caractéristiques de Walker).C'est-à-dire, observer les différences entre les crânes masculins et féminins en termes d'éminence mentale (MEN), de glabelle (GLA), de marge supraorbitaire (SUP), de crête nucale (NUC) et de processus mastoïde (MAS).
Par exemple, l’étude mentionne que l’espace entre les sourcils des hommes est généralement plus proéminent et plus large, et peut présenter des crêtes ou des nodules évidents ; tandis que l'espace entre les sourcils des femmes est plus lisse et plus fin. Les orbites des hommes sont généralement de forme carrée ou rectangulaire, avec des angles vifs et un aspect général plus dur ; Les orbites des femmes ont tendance à être plus rondes, avec des bords naturels et doux et sans bords évidents.
Cependant, avec le développement des activités d’anthropologie médico-légale, cette méthode a également trouvé certaines situations où elle n’est plus applicable.d'une part,Les échantillons de données obtenus par l’analyse des moyens d’identification représentés par cette méthode proviennent tous d’enregistrements physiques, c’est-à-dire qu’un grand nombre d’os physiques doivent être collectés pour obtenir des échantillons suffisants ;d'autre part,Les échantillons de cette méthode proviennent des peuples britanniques, américains et amérindiens qui ont vécu aux XIXe et XXe siècles, ce qui entraîne également certaines limitations dans l'efficacité temporelle et spatiale des sujets de recherche.
L’émergence de l’anthropologie virtuelle offre une nouvelle voie à la pratique de l’anthropologie médico-légale. En termes d’acquisition de données, contrairement à la méthode de collecte de données utilisée dans l’étude de Walker, la technologie d’imagerie numérique clinique telle que la tomodensitométrie (TDM) permet aux chercheurs d’obtenir des ensembles de données osseuses suffisants. Comparés à la collecte d’os physiques, les ensembles de données osseuses virtuelles enregistrées par imagerie clinique sont sans aucun doute plus faciles à établir. De plus, avec l’utilisation généralisée de la tomodensitométrie en médecine moderne, les ensembles de données obtenus grâce à cette méthode sont plus représentatifs de la population contemporaine.
En termes d’analyse et de traitement, les technologies basées sur l’apprentissage profond ont également été appliquées à l’anthropologie médico-légale. Les chercheurs utilisent l’apprentissage profond pour traiter de grands ensembles de données et créer des modèles permettant d’évaluer le sexe des os afin d’aider les anthropologues médico-légaux dans leurs évaluations biologiques. Par exemple, GoogleNet développé par Bewes et al. peut effectuer une reconstruction 3D à partir d'images latérales 2D de tomodensitométries de la tête et effectuer une identification du sexe squelettique sur la base de celles-ci.La précision de discrimination de 96% pour les hommes et de 94% pour les femmes a été atteinte.
Il convient de noter que même si ces méthodes ont fait de grands progrès, il existe encore quelques défis dans les précédentes méthodes d’identification du sexe des os basées sur l’apprentissage profond.Entièrement automatique et explicable.
Premièrement, certaines études se sont appuyées sur des logiciels commerciaux pour supprimer les structures environnantes et extraire le crâne en définissant le seuil de l’unité Hounsfield (HU) avec une valeur empirique, qui peut être affectée par des problèmes tels que l’accessibilité du logiciel, le bruit, les artefacts, les structures osseuses indésirables et la variabilité des valeurs HU.
Deuxièmement, contrairement aux observateurs humains qui identifient les caractéristiques du crâne, les réseaux basés sur l’apprentissage profond sont souvent appelés « boîtes noires » dans lesquelles les couches cachées sont généralement difficiles à structurer, ce qui limite également l’interprétabilité des réseaux basés sur l’apprentissage profond.
Plusieurs conceptions créent des cadres d'IA qui surpassent les humains
Dans cette étude, les chercheurs ont développé un cadre d’IA entièrement automatisé pour l’identification médico-légale du genre à l’aide de tomodensitogrammes du crâne et ont testé le modèle à l’aide des fonctionnalités proposées par Walker.
Le cadre d’IA se compose d’une étape de prétraitement et d’un réseau de classification des genres.Tout d'abord, un réseau d'apprentissage profond pré-entraîné est utilisé pour la segmentation du crâne, puis différentes configurations de réseau de classification sont formées à l'aide de différentes compositions d'entrée, en utilisant l'apprentissage multitâche pour générer des scores de fonctionnalités Walker et effectuer l'identification du sexe, ou l'apprentissage monotâche pour l'identification du sexe. Les paramètres réseau spécifiques sont indiqués dans la figure ci-dessous :

* I est l’image CT prétraitée ;
* (I, S) est une entrée à double canal, comprenant une image CT prétraitée et un masque crânien ;
* I∩S indique les régions individuelles du crâne ;
* N1 et N2 utilisent la fonction de perte combinée et N3 utilise la fonction de perte d'entropie croisée binaire.
Trois variantes de réseau d'apprentissage profond N1, N2 et N3 sont construites sur ResNet, qui se compose d'un bloc d'entrée et de trois blocs résiduels, notamment des couches d'activation de convolution 3D (Conv3D), de normalisation par lots (Batch Norm) et d'unité linéaire rectifiée (ReLU). Le bloc d'entrée se compose de 32 filtres et le bloc résiduel de 64, 128 et 256 filtres respectivement. La taille du noyau de Conv3D est de 3 x 3 x 3 . Comme le montre la figure suivante :


Tous les réseaux ont été implémentés dans Torch 2.0 en utilisant Python v3.9 et formés sur un GPU NVIDIA Tesla P100 avec 16 Go de RAM.
L'ensemble de données utilisé dans cette étude provient de l'hôpital général Dr Wahidin Sudirohusodo (RSWS), en Indonésie, et comprend principalement des tomodensitogrammes multi-coupes (MSCT) de certains patients ayant subi des examens radiologiques à l'hôpital de janvier 2020 à août 2022.Il y a 200 photos au total, dont 87 femmes et 113 hommes.166 images de l'ensemble de données sont utilisées pour la formation et 34 images sont utilisées pour les tests.
En examinant spécifiquement les trois architectures de réseau, la configuration multitâche de N2 (estimation du score de caractéristiques dimorphiques du crâne de Walker et du sexe dans différentes branches) a obtenu l'AUROC et la précision les plus élevées sous différentes entrées et était le modèle le plus équilibré pour l'identification du sexe. Lorsque la région du crâne est utilisée comme entrée,N2 a obtenu la précision la plus élevée de 0,97 et la perte logarithmique la plus faible de 0,30.
La configuration multitâche de N1 (estimer les scores des caractéristiques dimorphiques du crâne de Walker en séquence, puis estimer le sexe) utilise les régions du crâne comme entrée.Sa précision est de 0,91.Cependant, l'AUROC sous différentes entrées est inférieur à celui de N2 et N3, et la perte logarithmique est plus élevée.
L'AUROC du réseau à tâche unique N3 (estimant directement le sexe) sous différentes entrées est similaire à celui de N2, mais lorsque l'on utilise le crâne comme entrée,Sa précision n’est que de 0,85.Le plus bas parmi tous les réseaux. Les résultats spécifiques sont présentés dans la figure ci-dessous :

Il est à noter que, comparés aux performances des observateurs humains, les trois modèles de réseau basés sur l’apprentissage profond ont atteint une précision supérieure dans la classification des sexes que les observateurs humains. Spécifiquement,N2 a atteint la précision d'identification du genre la plus élevée de 97%, tandis que les observateurs humains n'ont atteint que 82%.
Pour améliorer l’interprétabilité du processus de prise de décision du réseau, l’équipe de recherche a utilisé la cartographie d’activation de classe pondérée par gradient (Gradient-CAM) pour visualiser les régions discriminantes du crâne identifiées par le réseau. Grad-CAM est une méthode permettant d'expliquer les décisions des réseaux de neurones convolutifs. L'idée clé est de multiplier le gradient de la catégorie de sortie avec la sortie de la couche, puis de prendre la moyenne pour obtenir une carte thermique « approximative ».Cette carte thermique peut être agrandie et superposée sur l'image d'origine pour montrer les zones sur lesquelles le modèle se concentre le plus lors de la classification.Son avantage est qu’il peut être utilisé pour n’importe quel réseau neuronal convolutif sans modification structurelle ni recyclage.
La figure ci-dessous montre la carte thermique Grad-CAM liée à chaque prédiction de fonctionnalité dans la branche de fonctionnalités Walker des réseaux N1 et N2 lors de l'utilisation du crâne comme entrée, où a, b, c, d et e sont respectivement GLA, MAS, MEN, NUC et SUP. La carte thermique met particulièrement en évidence GLA et NUC.

La figure ci-dessous montre les cartes thermiques de sortie Grad-CAM des 3 réseaux lors de l'utilisation du crâne comme entrée. On peut observer qu'en plus de l'activation du GLA, la zone autour du crâne est également activée, en particulier la carte thermique du N3 est plus évidente. Étant donné que les images CT sont prétraitées à une taille physique uniforme,Cela peut indiquer que le modèle analyse la morphologie de l’ensemble du crâne,C'est peut-être dû à sa taille et à sa forme, car la taille et la forme du crâne sont des caractéristiques clés reflétant le dimorphisme sexuel humain, les crânes masculins étant généralement plus grands et plus lourds que les crânes féminins.

En résumé, cette expérience démontre l’efficacité d’un cadre d’IA entièrement automatisé basé sur l’apprentissage profond pour améliorer la précision de la détermination du sexe du squelette, confirmant son applicabilité médico-légale nettement plus large par rapport aux méthodes sous-jacentes déjà développées. Dans le même temps, le cadre a le potentiel de surpasser les observateurs humains, en explorant son potentiel pour aider l’anthropologie médico-légale à devenir plus intelligente et automatisée.
De plus, Grad-CAM a également démontré l’interprétabilité des modèles de réseau basés sur l’apprentissage profond pour identifier le genre à travers les crânes. Ces intégrations ont donné lieu à des évaluations plus standardisées et objectives de l’anthropologie médico-légale, réduisant ainsi l’impact des biais cognitifs et de la variabilité.
L'IA ouvre un nouveau chapitre de l'anthropologie médico-légale
En fait, il existe de nombreuses études sur l’utilisation de l’IA pour renforcer l’identification du genre en anthropologie médico-légale. Par coïncidence, des articles connexes inclus dans Scientific Reports révèlent de nombreuses méthodes révolutionnaires.
Par exemple, une étude intitulée « Estimation du sexe à l'aide d'images de silhouette de crâne issues de la tomodensitométrie post-mortem par apprentissage profond » a utilisé des tomodensitogrammes pour obtenir des images de silhouette bidimensionnelles pour l'apprentissage profond, a amélioré la forme du contour du crâne, puis a observé les images de silhouette sous différents angles et a effectué un vote majoritaire pour déterminer le sexe.
Adresse du document :
https://www.nature.com/articles/s41598-024-74703-y
Une méthode de reconstruction craniofaciale basée sur l'apprentissage profond, développée conjointement par l'École d'informatique et l'École de médecine légale et de médecine fondamentale de Chine occidentale de l'Université du Sichuan, a réussi à restaurer automatiquement des images craniofaciales à partir de données de scanner crânien. Il a été mentionné que l'équipe de recherche a surmonté les difficultés techniques de la restauration craniofaciale et a développé le premier système de récupération du visage par reconstruction craniofaciale. Le système génère une série de visages restaurés d'âges et de sexes différents mais d'identités cohérentes basées sur des données de crâne, éliminant l'influence de l'âge et même des changements de déformation sur la reconnaissance d'identité, améliorant ainsi la précision de la reconnaissance.
L'article, intitulé « CR-GAN : reconstruction craniofaciale automatique pour l'identification personnelle », a été publié dans Pattern Recognition, une revue de premier plan dans le domaine de la reconnaissance de formes.
Adresse du document :
https://www.sciencedirect.com/science/article/abs/pii/S0031320321005768
Bien sûr, l’identification du sexe à partir des os ne repose pas uniquement sur le crâne. Comme mentionné précédemment, la structure osseuse cache de nombreuses informations différenciées sur les caractéristiques masculines et féminines. Par exemple, en raison des différentes fonctions physiologiques du bassin masculin et féminin, le bassin présente des caractéristiques différenciées très évidentes dans l’identification du genre. Sur la base de ces caractéristiques, des méthodes d’identification du genre basées sur l’apprentissage profond sont également étudiées simultanément.
En résumé, la popularité de l’IA offre une solution objective et durable au problème de l’identification du genre en anthropologie médico-légale. Cela permet également à ce domaine mystérieux et de niche de s'éloigner des anciennes méthodes d'identification et d'adopter progressivement l'intelligence et l'automatisation comme d'autres domaines.
Références :
1.https://www.nature.com/articles/s41598-024-81718-y
2.https://www.csiro.au/en/news/All/News/2025/February/CSIRO-develops-AI-tool-for-rapid-identification-in-forensic-investigations
3.https://blog.csdn.net/qq_68308828/article/details/132663304
4.https://mp.weixin.qq.com/s/bpZCZMM5MJRShhZvI2fcsw
Enfin, je voudrais recommander à tout le monde une diffusion académique en direct ! Le 7 mars à 12h00, la dernière diffusion en direct de Meet AI4S avait pour thème « Son pouvoir à l'ère de l'IA : la transformation sous la technologie hardcore » et invitaitHuang Hong, professeur associé à l'Université des sciences et technologies de Huazhong, Zhou Dongzhan, jeune chercheur au Centre d'IA pour les sciences du Laboratoire d'intelligence artificielle de Shanghai, et Zhou Bingxin, chercheur adjoint à l'Institut des sciences naturelles de l'Université Jiao Tong de Shanghai,Présentez vos réalisations personnelles et partagez votre expérience de recherche scientifique.