Command Palette
Search for a command to run...
MnasNet: Plattformbewusste Neuronale Architektursuche für Mobile Geräte
MnasNet: Plattformbewusste Neuronale Architektursuche für Mobile Geräte
Mingxing Tan Bo Chen Ruoming Pang Vijay Vasudevan Mark Sandler Andrew Howard Quoc V. Le
Abstract
Das Design von Faltungsneuronalen Netzen (CNN) für mobile Geräte ist herausfordernd, da mobile Modelle klein und schnell sein müssen, aber dennoch genaue Ergebnisse liefern. Obwohl erhebliche Anstrengungen unternommen wurden, um mobile CNNs in allen Aspekten zu entwickeln und zu verbessern, ist es sehr schwierig, diese Kompromisse manuell abzuwägen, wenn so viele architektonische Möglichkeiten berücksichtigt werden müssen. In dieser Arbeit schlagen wir einen automatisierten Ansatz zur Such nach mobilen Neuronalen Architekturen (MNAS) vor, der die Modell-Latenz explizit in das Hauptziel einbezieht, sodass die Suche ein Modell identifizieren kann, das eine gute Balance zwischen Genauigkeit und Latenz bietet. Im Gegensatz zu früheren Arbeiten, bei denen die Latenz über einen anderen, oft ungenauen Proxy (z.B. FLOPS) berücksichtigt wurde, misst unser Ansatz die tatsächliche Inferenz-Latenz direkt durch die Ausführung des Modells auf Mobiltelefonen. Um ferner den richtigen Kompromiss zwischen Flexibilität und Suchraumgröße zu finden, schlagen wir einen neuen faktorisierten hierarchischen Suchraum vor, der Vielfalt der Schichten im gesamten Netzwerk fördert. Experimentelle Ergebnisse zeigen, dass unser Ansatz konsistent bessere Leistungen als state-of-the-art mobile CNN-Modelle in mehreren visuellen Aufgaben erzielt. Bei der ImageNet-Klassifikationsaufgabe erreicht unser MnasNet eine Top-1-Genauigkeit von 75,2 % mit einer Latenz von 78 ms auf einem Pixel-Telefon. Dies ist 1,8-mal schneller als MobileNetV2 [29] mit einer 0,5 %-höheren Genauigkeit und 2,3-mal schneller als NASNet [36] mit einer 1,2 %-höheren Genauigkeit. Unser MnasNet erreicht auch eine bessere mAP-Qualität als MobileNets bei der COCO-Objekterkennung. Der Quellcode befindet sich unter https://github.com/tensorflow/tpu/tree/master/models/official/mnasnet.