Command Palette
Search for a command to run...
Benötigen Sie propriozeptive Zustände in visuomotorischen Politiken?

Abstract
Visuomotor-Politiken, die auf Imitation Learning basieren, werden weit verbreitet bei der Robotermanipulation eingesetzt, wobei typischerweise sowohl visuelle Beobachtungen als auch propriozeptive Zustände gemeinsam zur präzisen Steuerung herangezogen werden. In dieser Studie zeigen wir jedoch, dass diese gängige Vorgehensweise die Politik übermäßig von den propriozeptiven Zustandsinformationen abhängig macht, was zu einer Überanpassung an die Trainingspfade führt und eine schlechte räumliche Generalisierung verursacht. Im Gegensatz dazu schlagen wir die state-free Policy vor, bei der die propriozeptiven Zustände entfallen und Aktionen ausschließlich auf der Grundlage visueller Beobachtungen bedingt werden. Die state-free Policy basiert im relativen Endeffektor-Aktionsraum und setzt voraus, dass alle aufgabenrelevanten visuellen Informationen vollständig verfügbar sind – hier durch zwei weite Winkelkameras am Handgelenk bereitgestellt. Empirische Ergebnisse zeigen, dass die state-free Policy eine deutlich stärkere räumliche Generalisierung erreicht als die herkömmliche state-basierte Politik: In realen Aufgaben wie Pick-and-Place, anspruchsvollem Hemd-Falten und komplexer ganzkörperbasierter Manipulation, die verschiedene Robotertypen umfassen, steigt die durchschnittliche Erfolgsrate bei der Höhen-Generalisierung von 0 % auf 85 % und bei der Horizontal-Generalisierung von 6 % auf 64 %. Darüber hinaus weisen sie auch Vorteile in Bezug auf Daten-Effizienz und Anpassungsfähigkeit zwischen verschiedenen Robotertypen auf, was ihre praktische Relevanz für den Einsatz in der realen Welt erheblich erhöht.
KI mit KI entwickeln
Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.