Command Palette
Search for a command to run...
Axiomatische Zuordnung für tiefe Netze
Axiomatische Zuordnung für tiefe Netze
Sundararajan Mukund Taly Ankur Yan Qiqi
Zusammenfassung
Wir untersuchen das Problem der Zuordnung einer Vorhersage eines tiefen neuronalen Netzwerks zu seinen Eingabefeatures, ein Thema, das bereits von mehreren anderen Arbeiten behandelt wurde. Wir identifizieren zwei fundamentale Axiome – Sensitivität und Implementierungsunabhängigkeit –, die Attribution-Methoden erfüllen sollten. Wir zeigen, dass diese Axiome von den meisten bekannten Attribution-Methoden nicht erfüllt werden, was wir als eine grundlegende Schwäche dieser Methoden betrachten. Wir nutzen diese Axiome, um die Entwicklung einer neuen Attribution-Methode namens Integrated Gradients zu leiten. Unser Ansatz erfordert keine Modifikation des ursprünglichen Netzwerks und ist äußerst einfach zu implementieren; er benötigt lediglich einige Aufrufe des Standard-Gradientenoperators. Wir wenden diese Methode auf mehrere Bild-, Text- und Chemie-Modelle an und demonstrieren damit ihre Fähigkeit, Netzwerke zu debuggen, Regeln aus Netzwerken zu extrahieren und Nutzer zu ermöglichen, sich effektiver mit Modellen auseinanderzusetzen.