vor 6 Monaten

He Wang Zhizheng Zhang Qiyu Dai Songlin Wei Jiazhao Zhang Xiaomeng Fang Chaoyi Xu Haoran Geng Yufei Ding

Zusammenfassung

In dieser Arbeit treiben wir die Pionierarbeit bei der Entwicklung eines Benchmarks und einer Methode für table-top Open-instruction 6-DoF Object Rearrangement (Open6DOR) voran. Konkret sammeln wir einen synthetischen Datensatz mit über 200 Objekten und entwerfen sorgfältig mehr als 2400 Open6DOR-Aufgaben. Diese Aufgaben sind in die Kategorien Position-Track, Rotation-Track und 6-DoF-Track unterteilt, um verschiedene embodied Agents hinsichtlich ihrer Fähigkeit zur Vorhersage von Positionen und Rotationen von Zielobjekten zu evaluieren. Darüber hinaus stellen wir einen auf VLM basierenden Ansatz für Open6DOR vor, namens Open6DOR-GPT, der GPT-4V mit 3D-Bewusstsein und Simulationshilfe ausstattet, während gleichzeitig dessen Stärken in Bezug auf Generalisierbarkeit und Anweisungsfollowing für diese Aufgabe genutzt werden. Wir vergleichen bestehende embodied Agents mit unserem Open6DOR-GPT auf dem vorgeschlagenen Open6DOR-Benchmark und stellen fest, dass Open6DOR-GPT die derzeit beste Leistung erzielt. Zudem zeigen wir die beeindruckende Leistungsfähigkeit von Open6DOR-GPT in vielfältigen realen Experimenten. Wir planen, die finale Version des Benchmarks zusammen mit unserer verfeinerten Methode Anfang September freizugeben, und empfehlen daher, bis dahin zu warten, bevor man den Datensatz herunterlädt.

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Robotik

Multimodal

Multimodale Darstellung

Forschungsgebiet

Multimodal

Aufgabe

He Wang Zhizheng Zhang Qiyu Dai Songlin Wei Jiazhao Zhang Xiaomeng Fang Chaoyi Xu Haoran Geng Yufei Ding

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

vor 6 Monaten

Robotik

Multimodal

Multimodale Darstellung

Forschungsgebiet

Multimodal

Aufgabe

He Wang Zhizheng Zhang Qiyu Dai Songlin Wei Jiazhao Zhang Xiaomeng Fang Chaoyi Xu Haoran Geng Yufei Ding

Zusammenfassung

Quell-PDF Code anzeigen

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

Open6DOR: Benchmarking Open-instruction 6-DoF Object Rearrangement und ein VLM-basierter Ansatz

He Wang Zhizheng Zhang Qiyu Dai Songlin Wei Jiazhao Zhang Xiaomeng Fang Chaoyi Xu Haoran Geng Yufei Ding

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Open6DOR: Benchmarking Open-instruction 6-DoF Object Rearrangement und ein VLM-basierter Ansatz

He Wang Zhizheng Zhang Qiyu Dai Songlin Wei Jiazhao Zhang Xiaomeng Fang Chaoyi Xu Haoran Geng Yufei Ding

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

Open6DOR: Benchmarking Open-instruction 6-DoF Object Rearrangement und ein VLM-basierter Ansatz

He Wang Zhizheng Zhang Qiyu Dai Songlin Wei Jiazhao Zhang Xiaomeng Fang Chaoyi Xu Haoran Geng Yufei Ding

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters