HyperAIHyperAI
il y a 11 jours

Méthodes pour le labeliseur économe : segmentation sémantique multi-classes sur des étiquettes hétérogènes

{Markus Reischl, Christian Pylatiuk, Luca Rettenberger, Mark Schutera}
Méthodes pour le labeliseur économe : segmentation sémantique multi-classes sur des étiquettes hétérogènes
Résumé

L’apprentissage profond accélère de plus en plus la recherche biomédicale en mettant en œuvre des réseaux de neurones pour diverses tâches, telles que la classification d’images, la détection d’objets et la segmentation sémantique. Toutefois, les réseaux de neurones sont généralement entraînés de manière supervisée sur de grandes bases de données étiquetées. Ces prérequis posent des problèmes dans le domaine de la reconnaissance d’images biomédicales, car ces bases de données sont généralement de petite taille, difficiles à obtenir, coûteuses à étiqueter, et fréquemment étiquetées de manière hétérogène. De plus, les étiquettes hétérogènes constituent un défi pour les méthodes supervisées. Si toutes les classes ne sont pas étiquetées pour un même échantillon, les approches d’apprentissage profond supervisé ne peuvent apprendre qu’à partir d’un sous-ensemble des données, en se limitant aux étiquettes communes à chaque échantillon ; par conséquent, les ingénieurs en reconnaissance d’images biomédicales doivent être frugaux en matière d’exigences en étiquettes et en vérités terrain. Ce papier examine les effets de l’étiquetage frugal et propose d’entraîner des réseaux de neurones pour la segmentation sémantique multi-classes sur des données étiquetées de manière hétérogène, à l’aide d’une nouvelle fonction objectif. Cette fonction objectif combine une perte asymétrique par classe avec la perte Dice. L’approche est illustrée dans trois contextes : l’entraînement sur des vérités terrain rares issues d’une base de données étiquetées de manière hétérogène, l’entraînement dans un cadre d’apprentissage par transfert, et le cas d’utilisation de la fusion de plusieurs bases de données étiquetées de manière hétérogène. À cet effet, une base de données biomédicale de petite taille, destinée à la segmentation sémantique multi-classes, est utilisée. Le jeu de données heartSeg repose sur le poisson medaka comme système modèle cardiaque. L’automatisation de la reconnaissance d’images et de la segmentation sémantique permet des expériences à haut débit et est essentielle pour la recherche biomédicale. Notre approche et notre analyse montrent des résultats compétitifs dans les régimes d’entraînement supervisé et encouragent l’adoption de l’étiquetage frugal dans la reconnaissance d’images biomédicales.

Méthodes pour le labeliseur économe : segmentation sémantique multi-classes sur des étiquettes hétérogènes | Articles de recherche récents | HyperAI