vor 6 Monaten

Zusammenfassung

Die natürliche Sprache-basierte Kommunikation mit mobilen Geräten und Haushaltsgeräten gewinnt zunehmend an Bedeutung und hat das Potenzial, in Zukunft zur natürlichen Interaktion mit mobilen Robotern zu werden. Um dieses Ziel zu erreichen, untersuchen wir die cross-modal Text-zu-Punktwolken-Lokalisierung, die es ermöglicht, beispielsweise einen Fahrzeugabholort oder eine Lieferstelle über eine natürliche Sprachbeschreibung anzugeben. Insbesondere stellen wir Text2Pos vor, einen cross-modal Lokalisierungsmodul, der lernt, sprachliche Beschreibungen mit Lokalisierungshinweisen auf einer groben bis feinen Ebene zu verknüpfen. Gegeben eine Punktwolke der Umgebung lokalisiert Text2Pos eine Position, die über eine natürliche Sprachbeschreibung der unmittelbaren Umgebung spezifiziert ist. Um Text2Pos zu trainieren und seine Leistung zu evaluieren, erstellen wir KITTI360Pose, den ersten Datensatz für diese Aufgabe basierend auf dem kürzlich vorgestellten KITTI360-Datensatz. Unsere Experimente zeigen, dass wir 65 % der sprachlichen Anfragen innerhalb einer Distanz von 15 m zu den tatsächlichen Abfrageorten innerhalb der zehn besten zurückgegebenen Lokalisierungen lokalisieren können. Dies stellt einen ersten Ansatz dar, den wir hoffen, wird zukünftige Entwicklungen hin zu sprachbasierter Navigation anregen.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Multimodal

Natürliche Sprachverarbeitung

Geographische Information

Anwendungsgebiet

Natürliche Sprachverarbeitung

Multimodal

Aufgabe

Manuel Kolmet Qunjie Zhou Aljosa Osep Laura Leal-Taixe

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Multimodal

Natürliche Sprachverarbeitung

Geographische Information

Anwendungsgebiet

Natürliche Sprachverarbeitung

Multimodal

Aufgabe

Manuel Kolmet Qunjie Zhou Aljosa Osep Laura Leal-Taixe

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Text2Pos: Text-zu-Punktewolke Kreuzmodale Lokalisierung | Paper | HyperAI

Command Palette

Text2Pos: Text-zu-Punktewolke Kreuzmodale Lokalisierung

Manuel Kolmet Qunjie Zhou Aljosa Osep Laura Leal-Taixe

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Text2Pos: Text-zu-Punktewolke Kreuzmodale Lokalisierung

Manuel Kolmet Qunjie Zhou Aljosa Osep Laura Leal-Taixe

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Text2Pos: Text-zu-Punktewolke Kreuzmodale Lokalisierung

Manuel Kolmet Qunjie Zhou Aljosa Osep Laura Leal-Taixe

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters