Methoden für den sparsamen Labeler: Mehrklassen-Semantiksegmentierung mit heterogenen Labels

Deep Learning beschleunigt zunehmend die biomedizinische Forschung und setzt neuronale Netze für vielfältige Aufgaben ein, wie beispielsweise Bildklassifikation, Objekterkennung und semantische Segmentierung. Allerdings werden neuronale Netze üblicherweise überwacht auf großskaligen, beschrifteten Datensätzen trainiert. Diese Voraussetzungen bereiten jedoch erhebliche Herausforderungen in der biomedizinischen Bilderkennung, da Datensätze in der Regel klein, schwer zu beschaffen, kostspielig zu beschriften und häufig heterogen beschriftet sind. Darüber hinaus stellen heterogene Beschriftungen eine Herausforderung für überwachte Methoden dar. Wenn für eine einzelne Probe nicht alle Klassen beschriftet sind, können überwachte Deep-Learning-Ansätze lediglich auf einer Teilmenge des Datensatzes mit gemeinsamen Beschriftungen pro Probe trainieren; somit müssen Ingenieure der biomedizinischen Bilderkennung bei der Anforderung an Labels und Ground-Truth äußerst sparsam vorgehen. In diesem Beitrag werden die Auswirkungen einer sparsamen Beschriftung untersucht und ein Ansatz vorgeschlagen, neuronale Netze für die mehrklassige semantische Segmentierung auf heterogen beschrifteten Daten mittels einer neuartigen Zielfunktion zu trainieren. Die Zielfunktion kombiniert eine klassenasymmetrische Verlustfunktion mit der Dice-Loss-Funktion. Der Ansatz wird anhand von drei Szenarien demonstriert: dem Training auf spärlichen Ground-Truth-Daten eines heterogen beschrifteten Datensatzes, dem Training im Rahmen eines Transfer-Learning-Settings sowie dem Einsatzfall der Kombination mehrerer heterogen beschrifteter Datensätze. Hierfür wird ein biomedizinischer, kleinskaliger, mehrklassiger Datensatz für die semantische Segmentierung verwendet. Der heartSeg-Datensatz basiert auf der Medaka-Fisch-Position als kardiales Modellsystem. Die Automatisierung der Bilderkennung und semantischen Segmentierung ermöglicht hochdurchsatzfähige Experimente und ist für die biomedizinische Forschung essenziell. Unsere Methode und Analyse zeigen wettbewerbsfähige Ergebnisse in überwachten Trainingsregimen und fördern eine sparsame Beschriftung innerhalb der biomedizinischen Bilderkennung.