Ein unüberwachter Ansatz zur Erreichung von überwachungsähnlicher Erklärbarkeit in Gesundheitsakten

Elektronische Gesundheitsakten sind für die Patientensicherheit von entscheidender Bedeutung, da sie Zustände, Pläne und Verfahren sowohl in freier Textform als auch in medizinischen Codes dokumentieren. Sprachmodelle haben die Verarbeitung dieser Akten erheblich verbessert, indem sie Arbeitsabläufe optimieren und manuelle Dateneingabe reduzieren, wodurch den Gesundheitsdienstleistern erhebliche Ressourcen erspart werden. Dennoch führt die Black-Box-Natur dieser Modelle oft dazu, dass Gesundheitsfachkräfte ihnen misstrauen. Stand der Kunst Methoden zur Erklärbarkeit erhöhen zwar die Transparenz der Modelle, aber sie basieren auf menschlich annotierten Beweisabschnitten, die kostspielig sind. In dieser Studie schlagen wir einen Ansatz vor, um plausible und treue Erklärungen ohne solche Annotationen zu generieren. Wir zeigen am Beispiel der automatisierten medizinischen Kodierung, dass das adversarische Robustheitstraining die Plausibilität der Erklärungen verbessert und stellen AttInGrad vor, eine neue Erklärungsmethode, die den bisherigen überlegen ist. Durch Kombination beider Beiträge in einer vollständig unüberwachten Einstellung erzeugen wir Erklärungen von vergleichbarer oder sogar besserer Qualität als bei einem überwachten Ansatz. Wir veröffentlichen unseren Code und die Gewichte unseres Modells.