HyperAIHyperAI

Command Palette

Search for a command to run...

Partielle Ordnungsreduzierung: für den besten Kompromiss zwischen Geschwindigkeit und Genauigkeit bei der Such nach neuronalen Architekturen

Xin Li; Yiming Zhou; Zheng Pan; Jiashi Feng

Zusammenfassung

Die Erreichung eines guten Kompromisses zwischen Geschwindigkeit und Genauigkeit auf einer Zielplattform ist bei der Bereitstellung tiefer neuronaler Netze in realen Szenarien von großer Bedeutung. Die meisten existierenden Ansätze zur automatischen Architektursuche konzentrieren sich jedoch hauptsächlich auf hohe Leistung. In dieser Arbeit schlagen wir einen Algorithmus vor, der bessere Geschwindigkeits-/Genauigkeitskompromisse für gesuchte Netzwerke bieten kann und als "Partielle Ordnungsstutz" (Partial Order Pruning) bezeichnet wird. Dieser Algorithmus verkleinert den Suchraum für Architekturen unter der Annahme einer partiellen Ordnung, um automatisch die Architekturen mit dem besten Kompromiss zwischen Geschwindigkeit und Genauigkeit zu finden. Unser Algorithmus berücksichtigt explizit Profilinformationen über die Inferenzgeschwindigkeit auf der Zielplattform. Mit dem vorgeschlagenen Algorithmus stellen wir mehrere Dongfeng-Netzwerke (DF-Netzwerke) vor, die auf verschiedenen Anwendung-GPU-Plattformen hohe Genauigkeit und schnelle Inferenzgeschwindigkeit bieten. Durch eine weitere Suche nach Dekodierarchitekturen erzielen unsere DF-Seg Echtzeit-Segmentierungsnetzwerke den aktuellen Stand der Technik im Kompromiss zwischen Geschwindigkeit und Genauigkeit sowohl auf dem Ziel-Eingebetteten Gerät als auch auf hochwertigen GPUs.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Partielle Ordnungsreduzierung: für den besten Kompromiss zwischen Geschwindigkeit und Genauigkeit bei der Such nach neuronalen Architekturen | Paper | HyperAI