HyperAIHyperAI

Command Palette

Search for a command to run...

Stratégie De Vitesse Moyenne (MVP)

Date

il y a 14 heures

Organisation

L'Université de Hong Kong
Université Tsinghua
Université de Californie

URL du document

openreview.net

La politique de vitesse moyenne (MVP) a été proposée conjointement par des équipes de recherche de l'Université Tsinghua (École des véhicules et des transports et École d'intelligence artificielle), du BAIR (Laboratoire de recherche Baidu pour l'intelligence artificielle) de l'Université de Californie à Berkeley et de l'Université de Hong Kong. Ces travaux ont fait l'objet d'une publication officielle sous forme d'article de conférence lors de la Conférence internationale sur les représentations d'apprentissage (ICLR 2026) en 2026. Les résultats de recherche associés ont été publiés dans l'article « Politique de flux moyen avec contrainte de vitesse instantanée pour la génération d'actions en une étape".

MVP est une nouvelle politique générative pour l'apprentissage par renforcement qui permet une génération d'actions en une seule étape ultra-rapide grâce à la modélisation d'un « champ de vitesse moyen », éliminant ainsi la surcharge de calcul liée à l'échantillonnage multi-étapes. Pour pallier l'absence de conditions aux limites explicites dans le modèle, l'équipe de recherche a introduit des « contraintes de vitesse instantanée (IVC) », améliorant ainsi la précision de l'apprentissage et l'expressivité de la politique. En pratique, MVP améliore considérablement la vitesse d'entraînement et d'inférence (le temps d'inférence moyen par étape est de seulement 10,93 millisecondes) et atteint un taux de réussite moyen de 0,88 sur des tâches complexes de manipulation robotique dans Robomimic et OGBench, se hissant ainsi au sommet de la technologie dans ce domaine.

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp