Konzept-Graph-Embedding-Modelle zur verbesserten Genauigkeit und Interpretierbarkeit
In Bereichen mit hohem Verantwortungsbewusstsein ist es notwendig, verstehen zu können, wie Deep-Learning-Modelle Entscheidungen treffen, wenn sie die Ursachen einer Bildklassifikation analysieren. Kürzlich wurden konzeptbasierte Interpretationsmethoden eingeführt, um die internen Mechanismen von Deep-Learning-Modellen mithilfe hochwertiger Konzepte aufzudecken. Diese Methoden sind jedoch durch ein Spannungsverhältnis zwischen Genauigkeit und Interpretierbarkeit eingeschränkt. So stellt die präzise Vorhersage erwarteter Konzepte in realen Umgebungen, anders als in gut kuratierten Trainingsdaten, aufgrund der unterschiedlichen Verzerrungen und Komplexitäten, die durch verschiedene Objekte verursacht werden, eine Herausforderung dar. Um dieses Spannungsverhältnis zu überwinden, schlagen wir Konzept-Graph-Embedding-Modelle (CGEM) vor, die durch das Lernen gegenseitiger Richtungen komplexe Abhängigkeiten und Strukturen zwischen Konzepten abbilden. Der Konzept-Graph-Convolutional-Network (Concept GCN), eine nachgeschaltete Aufgabe von CGEM, unterscheidet sich von früheren Ansätzen, die lediglich die Anwesenheit von Konzepten feststellen, da er eine abschließende Klassifikation auf der Grundlage der durch Graph-Embedding erlernten Beziehungen zwischen Konzepten durchführt. Dieser Prozess verleiht dem Modell eine hohe Robustheit auch bei Vorhandensein falscher Konzepte. Zudem nutzen wir einen deformierbaren bipartiten GCN für die objektzentrierte Konzeptkodierung in frühen Stadien, was die Homogenität der Konzepte verbessert. Die experimentellen Ergebnisse zeigen, dass die CGEM-Implementierung mit deformierbarer Konzeptkodierung das Spannungsverhältnis zwischen Aufgabengenauigkeit und Interpretierbarkeit verringert. Darüber hinaus wurde bestätigt, dass dieser Ansatz es dem Modell ermöglicht, sowohl die Robustheit gegenüber verschiedenen realen Verzerrungen von Konzepten als auch die Resilienz und Interpretierbarkeit zu erhöhen, selbst bei fehlerhaften Konzepteingriffen. Unser Code ist unter https://github.com/jumpsnack/cgem verfügbar.