HyperAIHyperAI
vor 2 Monaten

RVT-2: Lernen präziser Manipulation aus wenigen Demonstrationen

Ankit Goyal, Valts Blukis, Jie Xu, Yijie Guo, Yu-Wei Chao, Dieter Fox
RVT-2: Lernen präziser Manipulation aus wenigen Demonstrationen
Abstract

In dieser Arbeit untersuchen wir, wie ein robotisches System konstruiert werden kann, das mehrere 3D-Manipulationsaufgaben auf der Grundlage von Sprachanweisungen lösen kann. Um in industriellen und häuslichen Bereichen nützlich zu sein, sollte ein solches System in der Lage sein, neue Aufgaben mit wenigen Demonstrationen zu erlernen und sie präzise zu lösen. Vorherige Arbeiten, wie PerAct und RVT, haben dieses Problem untersucht, jedoch oft Schwierigkeiten bei Aufgaben mit hohen Präzisionsanforderungen. Wir untersuchen, wie diese Systeme effektiver, präziser und schneller gemacht werden können. Durch eine Kombination architektur- und systemebener Verbesserungen schlagen wir RVT-2 vor, ein Multitask-3D-Manipulationsmodell, das sich sowohl im Training als auch in der Inferenz um den Faktor 6 und 2 schneller als sein Vorgänger RVT verhält. RVT-2 erreicht einen neuen Stand der Technik auf RLBench, indem es die Erfolgsrate von 65 % auf 82 % steigert. RVT-2 ist auch in der realen Welt effektiv, wo es Aufgaben mit hohen Präzisionsanforderungen, wie das Aufheben und Einführen von Steckern (plugs), mit nur zehn Demonstrationen erlernen kann. Visuelle Ergebnisse, Code und trainiertes Modell sind unter folgender Adresse verfügbar: https://robotic-view-transformer-2.github.io/.

RVT-2: Lernen präziser Manipulation aus wenigen Demonstrationen | Neueste Forschungsarbeiten | HyperAI