HyperAIHyperAI
vor einem Monat

Tiefes Lernen zur Erkennung von Robotergreifvorgängen

Ian Lenz; Honglak Lee; Ashutosh Saxena
Tiefes Lernen zur Erkennung von Robotergreifvorgängen
Abstract

Wir betrachten das Problem der Erkennung von Greifergriffen in einer RGB-D-Szene, die Objekte enthält. In dieser Arbeit wenden wir einen tiefen Lernansatz an, um dieses Problem zu lösen, der die zeitaufwendige manuelle Gestaltung von Merkmalen vermeidet. Dies stellt zwei Hauptherausforderungen dar. Erstens müssen wir eine große Anzahl von Kandidatengriffen bewerten. Um die Erkennung sowohl schnell als auch robust zu gestalten, präsentieren wir eine zweistufige kaskadierte Struktur mit zwei tiefen Netzen, bei der die besten Erkennungen des ersten Netzes vom zweiten erneut bewertet werden. Das erste Netzwerk hat weniger Merkmale, läuft schneller und kann unwahrscheinliche Kandidatengriffe effektiv aussortieren. Das zweite Netzwerk, das mehr Merkmale besitzt, ist langsamer, muss aber nur auf den besten wenigen Erkennungen ausgeführt werden. Zweitens müssen wir multimodale Eingaben gut verarbeiten können. Dafür präsentieren wir eine Methode zur Anwendung strukturierter Regularisierung auf die Gewichte basierend auf multimodaler Gruppenregularisierung (multimodal group regularization). Wir zeigen, dass unsere Methode die bisherigen Standesmethoden in der Roboter-Griff-Erkennung übertrifft und erfolgreich auf zwei verschiedenen Robotikplattformen eingesetzt werden kann.

Tiefes Lernen zur Erkennung von Robotergreifvorgängen | Neueste Forschungsarbeiten | HyperAI