Jenseits von Greifen und Plazieren: Die Bewältigung der Robotergestapelung verschiedener Formen

Wir untersuchen das Problem des Roboterstapels mit Objekten komplexer Geometrie. Wir schlagen eine anspruchsvolle und vielfältige Reihe solcher Objekte vor, die sorgfältig entwickelt wurde, um Strategien zu erfordern, die über eine einfache „Greif-und-Platz“-Lösung hinausgehen. Unser Ansatz kombiniert ein Verstärkungslernen (RL) mit visueller interaktiver Policy-Distillation und Transfer von Simulation zur Realität. Unsere gelernten Politiken können effizient verschiedene Kombinationen von Objekten in der realen Welt verarbeiten und zeigen eine große Vielfalt an Stapelkompetenzen. In einer umfangreichen experimentellen Studie untersuchen wir, welche Entscheidungen für das Lernen allgemeiner, auf Vision basierender Agenten in der Simulation relevant sind und welche Faktoren den optimalen Transfer zum echten Roboter beeinflussen. Anschließend nutzen wir die durch diese Politiken gesammelten Daten, um sie mittels Offline-RL zu verbessern. Ein Video und ein Blogbeitrag unseres Projekts werden als ergänzendes Material bereitgestellt.