HyperAIHyperAI
il y a 11 jours

EVICAN – un ensemble de données équilibré pour le développement d’algorithmes en segmentation de cellules et de noyaux

{Sapun H Parekh, Ronald E Unger, Mischa Schwendy}
Résumé

L’utilisation du deep learning pour l’analyse quantitative d’images connaît une croissance exponentielle. Toutefois, la formation d’algorithmes de deep learning précis et largement déployables nécessite une grande quantité de données annotées (données vérité terrain). Les collections d’images doivent non seulement inclure des milliers d’images pour offrir un nombre suffisant d’exemples d’objets (par exemple, cellules), mais également présenter un degré adéquat de hétérogénéité.Nous présentons un nouveau jeu de données, EVICAN – Expert Visual Cell Annotation, composé d’images en niveaux de gris partiellement annotées provenant de 30 lignées cellulaires différentes, acquises à l’aide de microscopes variés, de mécanismes de contraste divers et à différentes grossissements. Ce jeu de données est directement utilisable comme données d’entraînement pour des applications de vision par ordinateur. Avec 4 600 images et environ 26 000 cellules segmentées, notre collection constitue un ensemble d’apprentissage hautement hétérogène, inégalé dans le développement d’applications de deep learning en biologie cellulaire. À l’aide d’une implémentation de Mask R-CNN, nous démontrons une segmentation automatisée des cellules et des noyaux à partir d’images en contraste de phase, atteignant une précision moyenne de 61,6 % selon l’indice de Jaccard supérieur à 0,5.