Neuüberlegung der 6-DoF-Griffdetektion: Ein flexibles Framework für qualitativ hochwertiges Greifen

Robotergriff ist eine grundlegende Fähigkeit für komplexe Aufgaben und von zentraler Bedeutung für Intelligenz. Bei der allgemeinen 6-DoF-Griffdetektion extrahieren die meisten bisherigen Methoden direkt semantische oder geometrische Informationen auf Szenenebene, wobei jedoch nur wenige die Eignung für verschiedene nachgeschaltete Anwendungen berücksichtigen, wie beispielsweise zielgerichteten Griff. Um dieses Problem anzugehen, überdenken wir die 6-DoF-Griffdetektion von einer griffzentrierten Perspektive her und stellen einen universellen Griffrahmen vor, der sowohl Szenen- als auch zielgerichtete Griffe bewältigen kann. Unser Rahmenwerk, FlexLoG, besteht aus einem Flexible Guidance Module und einem Local Grasp Model. Insbesondere ist das Flexible Guidance Module sowohl mit globalen (z. B. Griff-Wärmebild) als auch lokalen (z. B. visueller Grundlegung) Anleitungen kompatibel, wodurch die Generierung hochwertiger Griffe für unterschiedliche Aufgaben ermöglicht wird. Das Local Grasp Model konzentriert sich auf objektunabhängige regionale Punkte und prognostiziert Griffe lokal und präzise. Experimentelle Ergebnisse zeigen, dass unser Rahmenwerk eine Verbesserung um über 18 % und 23 % auf den bisher nicht gesehenen Splits der GraspNet-1Billion-Datenbank erreicht. Zudem erzielen reale Roboterexperimente in drei unterschiedlichen Umgebungen eine Erfolgsquote von 95 %.