Skalierung breiter Residualnetzwerke für Panoptic Segmentation

Die Wide Residual Networks (Wide-ResNets), eine flache aber breite Variante der Residual Networks (ResNets), die durch das Stapeln einer geringen Anzahl von Residual-Blöcken mit großen Kanalzahlen charakterisiert sind, haben sich bei mehreren Aufgaben der dichten Vorhersage als äußerst leistungsfähig erwiesen. Seit ihrer Einführung hat sich die Architektur von Wide-ResNets jedoch über die Jahre praktisch nicht weiterentwickelt. In dieser Arbeit überprüfen wir erneut die Architekturgestaltung für die aktuell herausfordernde Aufgabe der panoptischen Segmentierung, die darauf abzielt, semantische und instanzbasierte Segmentierung zu vereinen. Als Basismodell wird ein Ansatz vorgestellt, der die einfache und effektive Squeeze-and-Excitation- und Switchable Atrous Convolution in Wide-ResNets integriert. Die Netzwerkkapazität wird anschließend durch Anpassung der Breite (d. h. der Kanalanzahl) und der Tiefe (d. h. der Anzahl der Schichten) erhöht oder verringert, wodurch eine Familie von SWideRNets (kurz für Scaling Wide Residual Networks) entsteht. Wir zeigen, dass diese einfache Skalierungsmethode, kombiniert mit einem Gitter-Suchverfahren, mehrere SWideRNet-Modelle identifiziert, die die bisherigen SOTA-Leistungen auf panoptischen Segmentierungsdatasets sowohl im Bereich schneller Modelle als auch starker Modelle erheblich übertreffen.