HyperAIHyperAI
il y a 2 mois

Découper les méthodes d'apprentissage auto-supervisé pour la vision par ordinateur en chirurgie

Ramesh, Sanat ; Srivastav, Vinkle ; Alapatt, Deepak ; Yu, Tong ; Murali, Aditya ; Sestini, Luca ; Nwoye, Chinedu Innocent ; Hamoud, Idris ; Sharma, Saurav ; Fleurentin, Antoine ; Exarchakis, Georgios ; Karargyris, Alexandros ; Padoy, Nicolas
Découper les méthodes d'apprentissage auto-supervisé pour la vision par ordinateur en chirurgie
Résumé

Le domaine de la vision informatique chirurgicale a connu des avancées considérables ces dernières années avec l'essor des méthodes basées sur les réseaux neuronaux profonds. Cependant, les approches standard de formation supervisée complète de ces modèles nécessitent d'importantes quantités de données annotées, imposant un coût prohibitif ; en particulier dans le domaine clinique. Les méthodes d'apprentissage auto-supervisé (SSL) qui commencent à gagner en popularité au sein de la communauté générale de la vision informatique représentent une solution potentielle à ces coûts d'annotation, permettant d'apprendre des représentations utiles à partir de données non étiquetées uniquement. Néanmoins, l'efficacité des méthodes SSL dans des domaines plus complexes et impactants, tels que la médecine et la chirurgie, reste limitée et peu explorée. Dans ce travail, nous répondons à ce besoin critique en examinant quatre méthodes SSL de pointe (MoCo v2, SimCLR, DINO, SwAV) dans le contexte de la vision informatique chirurgicale. Nous présentons une analyse exhaustive des performances de ces méthodes sur le jeu de données Cholec80 pour deux tâches fondamentales et populaires dans la compréhension du contexte chirurgical : reconnaissance des phases et détection de présence d'instruments. Nous examinons leur paramétrisation, puis leur comportement en fonction des quantités de données d'entraînement dans des configurations semi-supervisées. Le transfert correct de ces méthodes vers la chirurgie, tel qu'il est décrit et réalisé dans ce travail, entraîne des gains substantiels en termes de performance par rapport aux utilisations génériques du SSL – jusqu'à 7,4 % pour la reconnaissance des phases et 20 % pour la détection de présence d'instruments – ainsi que par rapport aux approches semi-supervisées les plus récentes pour la reconnaissance des phases – jusqu'à 14 %. Des résultats supplémentaires obtenus sur une sélection très diversifiée de jeux de données chirurgicaux montrent des propriétés de généralisation robustes. Le code est disponible à l'adresse suivante : https://github.com/CAMMA-public/SelfSupSurg.

Découper les méthodes d'apprentissage auto-supervisé pour la vision par ordinateur en chirurgie | Articles de recherche récents | HyperAI