vor 10 Monaten

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

Zusammenfassung

Obwohl tiefe neuronale Netze (DNNs) eine Paradigmenverschiebung hervorgerufen haben, stellt ihre exorbitante Rechenanforderung weiterhin eine zentrale Herausforderung für deren Einsatz am Edge – beispielsweise auf tragbaren Geräten und Smartphones – dar. Daher wird ein hybrider Edge-Cloud-Rechenrahmen vorgeschlagen, der einen Teil der Berechnungen in die Cloud verlagert, indem die DNN-Operationen unter der Annahme konstanter Netzwerkbedingungen naiv partitioniert werden. In der Praxis variiert der Netzwerkzustand jedoch erheblich je nach Kontext, und die Strategien zur DNN-Partitionierung sind nur begrenzt anpassungsfähig. In diesem Artikel untersuchen wir die strukturelle Flexibilität von DNNs, um das Edge-Modell an wechselnde Netzwerkbedingungen und unterschiedliche Einsatzplattformen anzupassen. Konkret entwickeln wir eine auf Verstärkendem Lernen basierende Entscheidungsmaschine, die nach Modelltransformationsstrategien sucht, um ein kombiniertes Ziel aus Modellgenauigkeit und Berechnungsverzögerung zu erreichen. Die Maschine generiert einen kontextbewussten Modellbaum, sodass das DNN zur Laufzeit entscheiden kann, auf welchen Modellzweig es wechseln soll. Die Ergebnisse aus Emulation und Feldexperimenten zeigen, dass unsere Methode eine Latenzreduktion von 30 % bis 50 % ermöglicht, ohne die Modellgenauigkeit zu beeinträchtigen.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

vor 10 Monaten

Tiefes Lernen

Neuronale Netze

KI-Compiler

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Auf Discord diskutieren

vor 10 Monaten

Tiefes Lernen

Neuronale Netze

KI-Compiler

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Kontextbewusste tiefe Modellkompression für Edge-Cloud-Computing | Paper | HyperAI

Command Palette

Kontextbewusste tiefe Modellkompression für Edge-Cloud-Computing

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Kontextbewusste tiefe Modellkompression für Edge-Cloud-Computing

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Kontextbewusste tiefe Modellkompression für Edge-Cloud-Computing

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters