MOS: Ein Schritt hin zur Skalierung der Außerhalb-Verteilungs-Erkennung für große semantische Räume

Die Erkennung von außerhalb der Verteilung liegenden (out-of-distribution, OOD) Eingaben stellt eine zentrale Herausforderung dar, wenn maschinelle Lernmodelle sicher in der realen Welt eingesetzt werden sollen. Bisherige Ansätze basieren hauptsächlich auf kleinen Datensätzen mit geringer Auflösung und sehr wenigen Klassenbezeichnungen (z. B. CIFAR). Dadurch bleibt die OOD-Erkennung für große Skalenbildklassifikationsaufgaben weitgehend unerforscht. In diesem Paper schließen wir diese kritische Lücke, indem wir einen gruppenbasierten OOD-Erkennungsansatz sowie eine neuartige OOD-Score-Funktion namens MOS vorstellen. Unser zentrales Konzept besteht darin, den großen semantischen Raum in kleinere Gruppen mit ähnlichen Konzepten zu zerlegen, wodurch die Entscheidungsgrenzen zwischen in-distribution- und out-of-distribution-Daten vereinfacht werden können, um eine effektive OOD-Erkennung zu ermöglichen. Unser Ansatz skaliert im Vergleich zu früheren Methoden erheblich besser bei hochdimensionalen Klassenräumen. Wir evaluieren Modelle, die auf ImageNet trainiert wurden, anhand vier sorgfältig zusammengestellter OOD-Datensätze mit vielfältigen Semantiken. MOS erreicht dabei den bisher besten Stand der Technik: Die durchschnittliche FPR95 wird um 14,33 % reduziert, während die Inferenzgeschwindigkeit gegenüber der bisher besten Methode um das Sechsfache beschleunigt wird.