Kreuzdimensionales Gewichtung für aggregierte tiefe Faltungsfunktionen

Wir schlagen eine einfache und direkte Methode vor, um mächtige Bildrepräsentationen durch die querdimensionale Gewichtung und Aggregation der Ausgaben von Schichten tiefster konvolutiver Neuronaler Netze zu erstellen. Zunächst präsentieren wir ein verallgemeinertes Framework, das eine breite Familie von Ansätzen umfasst und querdimensionale Pooling- und Gewichtungsschritte einschließt. Anschließend schlagen wir spezifische parameterfreie Verfahren sowohl für räumliche als auch für kanalweise Gewichtungen vor, die den Effekt hochaktiver räumlicher Responese steigern und gleichzeitig Sprunghaftigkeitseffekte regulieren. Wir führen Experimente auf verschiedenen öffentlichen Datensätzen für Bildsuche durch und zeigen, dass unser Ansatz den aktuellen Stand der Technik bei Ansätzen auf der Basis vorgeprägter Netze übertrifft. Darüber hinaus stellen wir eine benutzerfreundliche, quelloffene Implementierung zur Verfügung, die unsere Ergebnisse reproduziert.注释:- "querdimensionale" 用于描述跨维度的操作。- "Sprunghaftigkeitseffekte" 是一个不太常见的术语,用来描述“burstiness effects”(突发效应)。- "Responese" 是“responses”(响应)的德语化表达,虽然不是标准术语,但在上下文中可以理解。如果需要更标准的术语,可以考虑使用“Reaktionen”。