il y a 6 mois

Résumé

L'apprentissage par renforcement profond (DRL) a démontré son efficacité dans la résolution du problème de planification de trajet local (LPP). Toutefois, son application dans le monde réel reste très limitée en raison de l'inefficacité d'entraînement et de la faible capacité de généralisation des algorithmes DRL. Pour atténuer ces deux défis, nous proposons une solution intitulée Color, composée d’un cadre d’entraînement Actor-Sharer-Learner (ASL) et d’un simulateur orienté robot mobile nommé Sparrow. Plus précisément, le cadre ASL vise à améliorer l’efficacité de l’entraînement des algorithmes DRL. Il utilise un mode de collecte de données vectorisées (VDC) afin d’accélérer l’acquisition des données, découple la collecte des données de l’optimisation du modèle grâce à la multithreading, et relie partiellement ces deux étapes grâce à un mécanisme de retour temporel (TFM), permettant d’éviter à la fois le sous-utilisation et le surutilisation des données. Par ailleurs, le simulateur Sparrow repose sur un monde basé sur une grille 2D, des cinématiques simplifiées et un flux de données sans conversion, ce qui permet une conception légère. Cette légèreté favorise la diversité vectorisée, permettant ainsi des configurations de simulation diversifiées à travers de nombreuses copies d’environnements vectorisés, entraînant ainsi une amélioration significative de la capacité de généralisation de l’algorithme DRL entraîné. Des expériences approfondies, comprenant 57 environnements standards de DRL, 32 scénarios simulés et 36 scénarios réels de LPP, ont été menées afin de valider l’efficacité et la supériorité de notre méthode en termes d’efficacité et de généralisation. Le code source et la vidéo associées à cet article sont disponibles à l’adresse suivante : https://github.com/XinJingHao/Color.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Apprentissage Par Renforcement

Entraînement Du Modèle

Reconnaissance D'images

Approche/Framework

Vision Par Ordinateur

Tâche

Jinghao Xin Jinwoo Kim Zhi Li Ning Li

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 6 mois

Apprentissage Par Renforcement

Entraînement Du Modèle

Reconnaissance D'images

Approche/Framework

Vision Par Ordinateur

Tâche

Jinghao Xin Jinwoo Kim Zhi Li Ning Li

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Entraîner un planificateur de trajet local réel en une heure via un apprentissage par renforcement partiellement découplé et une diversité vectorisée

Jinghao Xin Jinwoo Kim Zhi Li Ning Li

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Entraîner un planificateur de trajet local réel en une heure via un apprentissage par renforcement partiellement découplé et une diversité vectorisée

Jinghao Xin Jinwoo Kim Zhi Li Ning Li

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Entraîner un planificateur de trajet local réel en une heure via un apprentissage par renforcement partiellement découplé et une diversité vectorisée

Jinghao Xin Jinwoo Kim Zhi Li Ning Li

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters