HyperAIHyperAI
vor einem Monat

CogDDN: Eine kognitionsbasierte navigationsgesteuerte Entscheidungsoptimierung mit dualer Prozessverarbeitung

Yuehao Huang, Liang Liu, Shuangming Lei, Yukai Ma, Hao Su, Jianbiao Mei, Pengxiang Zhao, Yaqing Gu, Yong Liu, Jiajun Lv
CogDDN: Eine kognitionsbasierte navigationsgesteuerte Entscheidungsoptimierung mit dualer Prozessverarbeitung
Abstract

Mobilroboter werden zunehmend benötigt, um in unbekannten und unstrukturierten Umgebungen zu navigieren und zu interagieren, um menschliche Anforderungen zu erfüllen. Die nachfragegetriebene Navigation (DDN) ermöglicht es Robotern, Objekte basierend auf implizitem menschlichen Wille zu identifizieren und zu lokalisieren, auch wenn die Positionen der Objekte unbekannt sind. Traditionelle datengetriebene DDN-Methoden hingegen basieren auf vorher gesammelten Daten für das Modelltraining und die Entscheidungsfindung, was ihre Generalisierungsfähigkeit in neuen Szenarien einschränkt. In dieser Arbeit schlagen wir CogDDN vor, ein Framework auf Basis von visuellen Sprachmodellen (VLM), das durch die Integration schneller und langsamer Denksysteme sowie die selektive Identifikation von Schlüsselobjekten, die für den Erfüllung von Benutzeranforderungen essentiell sind, die menschlichen kognitiven und Lernmechanismen nachahmt. CogDDN identifiziert geeignete Zielobjekte durch semantische Ausrichtung der erkannten Objekte mit den gegebenen Anweisungen. Darüber hinaus verfügt es über ein zweiphasiges Entscheidungsmodul, das aus einem Heuristischen Prozess zur schnellen und effizienten Entscheidungsfindung und einem Analytischen Prozess besteht, der vergangene Fehler analysiert, sie in einer Wissensbasis sammelt und die Leistung kontinuierlich verbessert. Die Kette des Denkens (Chain of Thought [CoT]) stärkt den Entscheidungsprozess. Ausführliche geschlossene Schleifenbewertungen im AI2Thor-Simulator mit dem ProcThor-Datensatz zeigen, dass CogDDN einssichtige Kameraspezifische Methoden um 15 % übertrifft und somit erhebliche Verbesserungen in der Navigationsgenauigkeit und Anpassungsfähigkeit demonstriert. Die Projektseite ist unter dieser HTTPS-URL verfügbar.