HyperAIHyperAI

Command Palette

Search for a command to run...

Anweisungsbasierte, historische Bewusstsein erzeugende Strategien für robotergesteuerte Manipulationen

Pierre-Louis Guhur Shizhe Chen Ricardo Garcia Makarand Tapaswi Ivan Laptev Cordelia Schmid

Zusammenfassung

In menschlichen Umgebungen werden von Robotern erwartet, dass sie bei einfachen natürlichsprachlichen Anweisungen eine Vielzahl von Manipulationsaufgaben ausführen. Dennoch ist die roboterische Manipulation äußerst herausfordernd, da sie feingranulare Bewegungssteuerung, Langzeitgedächtnis sowie die Verallgemeinerung auf bisher unbekannte Aufgaben und Umgebungen erfordert. Um diesen Herausforderungen zu begegnen, schlagen wir einen einheitlichen Ansatz basierend auf Transformatoren vor, der mehrere Eingaben berücksichtigt. Insbesondere integriert unsere Transformer-Architektur (i) natürlichsprachliche Anweisungen und (ii) multiview-Szenenbeobachtungen, während sie (iii) den gesamten Beobachtungs- und Aktionshistorie verfolgt. Dieser Ansatz ermöglicht das Lernen von Abhängigkeiten zwischen Historie und Anweisungen und verbessert die Manipulationsgenauigkeit durch die Nutzung mehrerer Sichten. Wir evaluieren unsere Methode anhand des anspruchsvollen RLBench-Benchmarks und an einem realen Roboter. Bemerkenswerterweise skaliert unser Ansatz auf 74 verschiedene RLBench-Aufgaben und übertrifft den Stand der Technik. Zudem behandeln wir instruktionsbedingte Aufgaben und zeigen eine ausgezeichnete Verallgemeinerungsfähigkeit für bisher unbekannte Variationen.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp