Score-CAM: Score-gewichtete visuelle Erklärungen für Faltungsneuronale Netze

Kürzlich hat sich zunehmendes Interesse den internen Mechanismen von Faltungsneuronalen Netzen (Convolutional Neural Networks, CNNs) und den Gründen für deren spezifische Entscheidungen zugewandt. In dieser Arbeit entwickeln wir eine neuartige nachgelagerte visuelle Erklärungsmethode namens Score-CAM, die auf der Klassaktivierungskarte (Class Activation Mapping, CAM) basiert. Im Gegensatz zu früheren Ansätzen, die auf Klassaktivierungskarten basieren, entledigt sich Score-CAM der Abhängigkeit von Gradienten, indem es das Gewicht jeder Aktivierungskarte durch deren Vorwärtsdurchgangswert (forward passing score) für die Zielklasse bestimmt. Das endgültige Ergebnis wird durch eine lineare Kombination aus Gewichten und Aktivierungskarten erzielt. Wir zeigen, dass Score-CAM bessere visuelle Leistung und Fairness bei der Interpretation des Entscheidungsprozesses erreicht. Unser Ansatz übertrifft frühere Methoden sowohl in Aufgaben der Erkennung als auch der Lokalisierung und besteht auch den Plausibilitätstest (sanity check). Darüber hinaus weisen wir auf dessen Anwendung als Debugging-Tool hin. Der offizielle Code wurde veröffentlicht.