HyperAIHyperAI

Command Palette

Search for a command to run...

il y a 10 jours
Robotique
LLM
Multimodal

MIT développe une mémoire spatiale pour robots IA

Des chercheurs du MIT ont présenté DAAAM, un nouveau cadre de mémoire à long terme conçu pour doter les robots d'un raisonnement spatio-temporel similaire à celui des humains. Présentée récemment lors de la Conférence on Computer Vision and Pattern Recognition (CVPR), cette approche résout une limite majeure de l'autonomie robotique : la capacité de se souvenir et de restituer des détails contextuels dans de vastes environnements. Coordonnée par l'assistant professeur Luca Carlone et le doctorant Nicolas Gorlo, la méthode fusionne la vision par ordinateur et la cartographie robotique pour transformer des modèles tridimensionnels standards en cartes linguistiques accessibles. Les systèmes de cartographie traditionnels offrent une précision géométrique mais manquent de descriptions, tandis que les modèles de vision par ordinateur saisissent les détails visuels sans toujours les ancrer spatialement ni garantir une vitesse suffisante. DAAAM surmonte ces écueils en scanner l'environnement et en associant des annotations textuelles riches aux données visuelles. Pour accélérer le processus, le cadre regroupe les objets voisins, sélectionne les images clés pour une annotation parallèle et réduit le temps de calcul par dix. Chaque lot annoté est géolocalisé dans la carte tridimensionnelle, permettant au robot de rappeler instantanément des informations complexes, comme l'emplacement exact d'un assemblage ou l'état de vélos stationnés. L'interrogation du robot s'effectue en langage naturel grâce à un modèle de langage large intégré à des outils de recherche spécialisés. Cette architecture limite les erreurs de synthèse et permet des réponses précises en quelques secondes. Lors des tests, DAAAM a démontré une précision supérieure de vingt et un à cinquante-trois pour cent par rapport aux méthodes existantes, selon le type de question. Le système fonctionne suffisamment vite pour un déploiement en temps réel sur des robots mobiles. Au-delà des usines, où un opérateur pourrait ordonner à une machine d'aller chercher un composant déposé la veille, la technologie s'ouvre aux réalités augmentées. Elle pourrait assister les techniciens de maintenance dans la détection d'anomalies ou guider les usagers dans de grands complexes. Cette avancée illustre la volonté croissante d'aligner le raisonnement artificiel sur la logique spatiale et temporelle humaine. Les chercheurs prévoient d'élargir le cadre pour enregistrer les événements marquants et d'y intégrer des indicateurs de confiance. Financée par le laboratoire de recherche de l'armée américaine et le bureau de la recherche navale, cette innovation pose les bases d'agents autonomes polyvalents capables de collaborer efficacement avec les humains.

Liens associés