il y a 10 mois

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

Résumé

Bien que les réseaux de neurones profonds (DNN) aient entraîné un changement de paradigme, leur exigence computationnelle excessive constitue depuis toujours un obstacle majeur à leur déploiement sur le bord (edge), notamment sur des dispositifs portables et les smartphones. Ainsi, un cadre computationnel hybride edge-cloud a été proposé afin de transférer une partie du calcul vers le cloud, en partitionnant de manière naïve les opérations du DNN sous l’hypothèse d’un état réseau constant. Toutefois, dans le monde réel, l’état du réseau varie considérablement selon le contexte, et les stratégies de partitionnement du DNN restent très limitées. Dans ce travail, nous explorons la flexibilité structurelle des DNN afin d’adapter le modèle edge à différents contextes réseau et plates-formes de déploiement. Plus précisément, nous avons conçu un moteur décisionnel basé sur l’apprentissage par renforcement pour rechercher des stratégies de transformation de modèle en réponse à un objectif combiné de précision du modèle et de latence computationnelle. Ce moteur génère un arbre de modèles contextuel, permettant au DNN de choisir dynamiquement la branche du modèle à activer à l’exécution. Les résultats d’émulation et d’expérimentations terrain montrent que notre approche permet une réduction de 30 % à 50 % de la latence tout en préservant la précision du modèle.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Discuter sur Discord

il y a 10 mois

Apprentissage Profond

Réseaux De Neurones

Compilateur IA

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Discuter sur Discord

il y a 10 mois

Apprentissage Profond

Réseaux De Neurones

Compilateur IA

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Compression profonde contextuelle pour le calcul en périphérie cloud | Articles | HyperAI

Command Palette

Compression profonde contextuelle pour le calcul en périphérie cloud

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Compression profonde contextuelle pour le calcul en périphérie cloud

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Compression profonde contextuelle pour le calcul en périphérie cloud

Baochun Li Xinbing Wang Dixi Yao Xing Zhao Jiaju Chen Jiayu Xu Liyao Xiang Lingdong Wang

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters