SURE: SUrvey REcipes für die Erstellung zuverlässiger und robuster tiefer Netzwerke

In dieser Arbeit untersuchen wir erneut Techniken zur Unsicherheitsschätzung innerhalb tiefer neuronaler Netze und konsolidieren eine Reihe von Methoden, um ihre Zuverlässigkeit zu verbessern. Unsere Untersuchungen zeigen, dass eine integrierte Anwendung verschiedener Techniken – die Modellregularisierung, Klassifikatoren und Optimierung umfassen – die Genauigkeit der Unsicherheitsschätzungen bei Bildklassifizierungsaufgaben erheblich steigert. Der synergetische Effekt dieser Techniken mündet in unserem neuartigen SURE-Ansatz (SURE). Wir evaluieren SURE streng anhand des Benchmarks für Fehlerschätzung, einer wichtigen Testumgebung für die Effizienz der Unsicherheitsschätzung. Unsere Ergebnisse demonstrieren eine konsequent bessere Leistung als Modelle, die jede Technik einzeln einsetzen, über verschiedene Datensätze und Modellarchitekturen hinweg. Bei der Anwendung auf reale Herausforderungen wie Datenkorruption, Etikettengeräusche und langschwänzige Klassenverteilung zeigt SURE bemerkenswerte Robustheit und liefert Ergebnisse, die denen der aktuellen spezialisierten Methoden des State-of-the-Art überlegen oder gleichwertig sind. Insbesondere bei den Aufgaben mit verrauschten Etiketten in Animal-10N und Food-101N erreicht SURE State-of-the-Art-Leistungen ohne aufgabenspezifische Anpassungen. Diese Arbeit setzt nicht nur einen neuen Standard für robuste Unsicherheitsschätzung, sondern bahnt auch den Weg für ihre Anwendung in vielfältigen, realen Szenarien, in denen Zuverlässigkeit von entscheidender Bedeutung ist. Unser Code ist unter \url{https://yutingli0606.github.io/SURE/} verfügbar.