NOH-NMS: Verbesserung der Fußgängererkennung durch Halluzination benachbarter Objekte

Greedy-NMS birgt inhärent ein Dilemma, bei dem ein niedriger NMS-Schwellenwert potenziell zu einer geringeren Recall-Rate führt, während ein höherer Schwellenwert mehr falsch-positive Erkennungen verursacht. Dieses Problem ist bei der Fußgängererkennung besonders ausgeprägt, da die Dichte der Objekte stärker schwankt. Bisherige Arbeiten zu NMS berücksichtigen den Faktor benachbarter Fußgänger entweder nicht oder nur vage. Daher schlagen wir den Nearby Objects Hallucinator (NOH) vor, der die Objekte in der Nähe jedes Vorschlags mittels einer Gauß-Verteilung präzise lokalisiert, sowie NOH-NMS, das die Unterdrückung dynamisch verringert für Bereiche, in denen mit hoher Wahrscheinlichkeit weitere Objekte vorhanden sind. Im Vergleich zu Greedy-NMS erreicht unsere Methode, die der derzeitige Stand der Technik darstellt, eine Verbesserung um $3,9\%$ AP, $5,1\%$ Recall und $0,8\%$ $\text{MR}^{-2}$ auf dem CrowdHuman-Datensatz, wodurch sich AP auf $89,0\%$, Recall auf $92,9\%$ und $\text{MR}^{-2}$ auf $43,9\%$ erhöht.