Suche nach MobileNetV3

Wir präsentieren die nächste Generation von MobileNets, die auf einer Kombination ergänzender Suchtechniken sowie einem neuen Architekturdesign basiert. MobileNetV3 wurde für Mobiltelefon-CPU-Prozessoren durch eine Kombination hardwarebewusster Netzwerkarchitektursuche (NAS) und des NetAdapt-Algorithmus optimiert und anschließend durch innovative Architekturvorschläge verbessert. In dieser Arbeit beginnen wir mit der Untersuchung, wie automatisierte Suchalgorithmen und Netzwerkkonzeption zusammenarbeiten können, um ergänzende Ansätze zu nutzen und den Gesamtstand der Technik zu verbessern. Durch diesen Prozess schaffen wir zwei neue MobileNet-Modelle zur Veröffentlichung: MobileNetV3-Large und MobileNetV3-Small, die für Anwendungsfälle mit hohen und niedrigen Ressourcen ausgelegt sind. Diese Modelle werden dann angepasst und auf die Aufgaben der Objekterkennung und semantischen Segmentierung angewendet. Für die semantische Segmentierung (oder jede dichte Pixelvorhersage) schlagen wir einen neuen effizienten Segmentierungsdekoder vor: Lite Reduced Atrous Spatial Pyramid Pooling (LR-ASPP). Wir erzielen neue Standder-Aussagen in der mobilen Klassifizierung, Erkennung und Segmentierung. MobileNetV3-Large erreicht bei der ImageNet-Klassifizierung eine Genauigkeit von 3,2 % höher als MobileNetV2, während es gleichzeitig die Latenz um 15 % reduziert. MobileNetV3-Small ist 4,6 % genauer und reduziert die Latenz um 5 % im Vergleich zu MobileNetV2. Die Objekterkennung mit MobileNetV3-Large ist auf COCO-Detektion etwa 25 % schneller bei vergleichbarer Genauigkeit als MobileNetV2. Bei der Cityscapes-Segmentierung ist MobileNetV3-Large LR-ASPP etwa 30 % schneller als MobileNetV2 R-ASPP bei ähnlicher Genauigkeit.请注意,"Standder-Aussagen" 是 "state of the art" 的直译,但这个术语在德语中并不常用。通常情况下,我们会直接说 "neue Standards" 或者 "den aktuellen Stand der Technik". 如果您希望使用更地道的表达,请考虑以下版本:Wir erzielen neue Standards in der mobilen Klassifizierung, Erkennung und Segmentierung.