HyperAIHyperAI

Command Palette

Search for a command to run...

DEEDEE : Détection rapide et évolutif des dynamiques hors distribution

Tala Aljaafari Varun Kanade Philip Torr Christian Schroeder de Witt

Résumé

Le déploiement de l’apprentissage par renforcement (RL) dans des contextes critiques pour la sécurité est freiné par sa fragilité en cas de décalage de distribution. Nous étudions la détection d’observations hors distribution (OOD) dans le cadre du RL sur séries temporelles, et introduisons DEEDEE, un détecteur basé sur deux statistiques qui reconsidère les approches intensives en représentations en proposant une alternative minimale. DEEDEE n’utilise que la moyenne par épisode et une similarité basée sur un noyau RBF par rapport à un résumé d’entraînement, permettant de capturer des déviations globales et locales complémentaires. Malgré sa simplicité, DEEDEE égale ou dépasse les détecteurs contemporains sur des benchmarks standards de détection OOD en RL, offrant une réduction de 600 fois en ressources informatiques (FLOPs / temps réel) et une amélioration moyenne de 5 % en précision absolue par rapport à des baselines performantes. Conceptuellement, nos résultats suggèrent que divers types d’anomalies se manifestent souvent sur les trajectoires de RL à travers un petit ensemble de statistiques d’ordre faible, ouvrant la voie à une base compacte pour la détection OOD dans des environnements complexes.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp