Évaluation de l'apprentissage auto-supervisé sur des jeux de données de pathologie diversifiés

La pathologie computationnelle peut contribuer à sauver des vies humaines, mais les modèles sont très exigeants en annotations, et l’étiquetage des images de pathologie est particulièrement coûteux. L’apprentissage auto-supervisé s’est révélé être une méthode efficace pour exploiter les données non étiquetées, et son application à la pathologie pourrait grandement bénéficier aux tâches ultérieures. Toutefois, aucune étude rigoureuse n’a encore comparé les méthodes d’apprentissage auto-supervisé ni exploré comment les adapter au domaine de la pathologie. Pour combler ce manque, nous menons l’étude la plus vaste à ce jour sur le pré-entraînement auto-supervisé appliqué aux données d’images de pathologie. Notre recherche repose sur quatre méthodes représentatives d’apprentissage auto-supervisé, évaluées sur des tâches下游 diverses. Nous démontrons que le pré-entraînement à grande échelle et aligné au domaine en pathologie surpasse de manière cohérente le pré-entraînement sur ImageNet dans des configurations standards d’apprentissage auto-supervisé, telles que les évaluations linéaires et le fine-tuning, ainsi que dans des scénarios à faible nombre d’étiquettes. En outre, nous proposons un ensemble de techniques spécifiques au domaine, dont nous montrons expérimentalement l’efficacité pour améliorer les performances. Enfin, pour la première fois, nous appliquons l’apprentissage auto-supervisé à la tâche exigeante de segmentation d’instances de noyaux cellulaires, et démontrons des améliorations importantes et cohérentes des performances dans diverses conditions.