Multilabel-Klassifikation retinaler Erkrankungen unter Verwendung von Transformers

Die Früherkennung retinaler Erkrankungen ist eine der wichtigsten Maßnahmen zur Verhinderung einer partiellen oder dauerhaften Erblindung bei Patienten. In dieser Forschungsarbeit wird ein neuartiges Multi-Label-Klassifikationssystem zur Detektion mehrerer retinaler Erkrankungen vorgestellt, das Fundusbildern aus verschiedenen Quellen zugrunde liegt. Zunächst wird ein neues Multi-Label-Datensatz für retinale Erkrankungen, der MuReD-Datensatz, auf Basis mehrerer öffentlich verfügbarer Datensätze für die Klassifikation von Funduserkrankungen erstellt. Anschließend werden eine Reihe von Nachbearbeitungsschritten durchgeführt, um die Qualität der Bilddaten und die Bandbreite der in dem Datensatz enthaltenen Erkrankungen zu gewährleisten. Erstmals in der Forschung zu Multi-Label-Klassifikation von Fundusbildern wird ein auf Transformers basierendes Modell eingesetzt, das durch umfangreiche Experimente optimiert wurde, um die Bildanalyse und Entscheidungsfindung durchzuführen. Um die Konfiguration des vorgeschlagenen Systems zu optimieren, werden zahlreiche Experimente durchgeführt. Es zeigt sich, dass der Ansatz gegenüber aktuellen State-of-the-Art-Verfahren bei der gleichen Aufgabe in Bezug auf den AUC-Score für die Erkrankungserkennung und die Erkrankungsklassifikation jeweils um 7,9 % und 8,1 % übertrifft. Die erzielten Ergebnisse untermauern zudem das hohe Potenzial transformerbasierter Architekturen im Bereich der medizinischen Bildanalyse.