vor 7 Monaten

Jun Cen Chaohui Yu Hangjie Yuan Yuming Jiang Siteng Huang Jiayan Guo Xin Li Yibing Song Hao Luo Fan Wang

Zusammenfassung

Wir stellen WorldVLA vor, ein autoregressives Aktionsweltmodell, das die Aktionserkennung und -generierung sowie die Bildverarbeitung vereint. Unser WorldVLA integriert das Vision-Language-Action (VLA)-Modell und das Weltmodell in einem einzigen Rahmen. Das Weltmodell nutzt sowohl die Aktionserkennung als auch die Bildverarbeitung, um zukünftige Bilder vorherzusagen, wobei das Ziel ist, die zugrunde liegende Physik der Umgebung zu lernen, um die Aktionsgenerierung zu verbessern. Gleichzeitig generiert das Aktionen-Modell nachfolgende Aktionen auf Basis von Bildbeobachtungen, was der visuellen Verarbeitung hilft und somit die visuelle Generierung des Weltmodells unterstützt. Wir zeigen, dass WorldVLA stand-alone-Aktions- und Weltmodelle übertrifft und unterstreichen die gegenseitige Verbesserung zwischen dem Weltmodell und dem Aktionsmodell. Darüber hinaus stellen wir fest, dass die Leistung des Aktionsmodells bei der autoregressiven Generierung von Aktionssequenzen nachlässt. Dieses Phänomen kann auf das begrenzte Generalisierungsvermögen des Modells für die Aktionsvorhersage zurückgeführt werden, was zu einer Fehlerfortpflanzung von früheren auf nachfolgende Aktionen führt. Um dieses Problem zu lösen, schlagen wir eine Aufmerksamkeitsmaske-Strategie vor, die selektiv frühere Aktionen während der Generierung der aktuellen Aktion maskiert. Diese Strategie zeigt erhebliche Leistungsverbesserungen in der Aufgabe der Aktionsblockgenerierung.

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 7 Monaten

Jun Cen Chaohui Yu Hangjie Yuan Yuming Jiang Siteng Huang Jiayan Guo Xin Li Yibing Song Hao Luo Fan Wang

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

vor 7 Monaten

Jun Cen Chaohui Yu Hangjie Yuan Yuming Jiang Siteng Huang Jiayan Guo Xin Li Yibing Song Hao Luo Fan Wang

Zusammenfassung

Quell-PDF

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

WorldVLA: Auf dem Weg zu einem autoregressiven Aktionsweltmodell

Jun Cen Chaohui Yu Hangjie Yuan Yuming Jiang Siteng Huang Jiayan Guo Xin Li Yibing Song Hao Luo Fan Wang2 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

WorldVLA: Auf dem Weg zu einem autoregressiven Aktionsweltmodell

Jun Cen Chaohui Yu Hangjie Yuan Yuming Jiang Siteng Huang Jiayan Guo Xin Li Yibing Song Hao Luo Fan Wang2 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

WorldVLA: Auf dem Weg zu einem autoregressiven Aktionsweltmodell

Jun Cen Chaohui Yu Hangjie Yuan Yuming Jiang Siteng Huang Jiayan Guo Xin Li Yibing Song Hao Luo Fan Wang2 more

Zusammenfassung

KI mit KI entwickeln

HyperAI Newsletters

Jun Cen Chaohui Yu Hangjie Yuan Yuming Jiang Siteng Huang Jiayan Guo Xin Li Yibing Song Hao Luo Fan Wang

Jun Cen Chaohui Yu Hangjie Yuan Yuming Jiang Siteng Huang Jiayan Guo Xin Li Yibing Song Hao Luo Fan Wang

Jun Cen Chaohui Yu Hangjie Yuan Yuming Jiang Siteng Huang Jiayan Guo Xin Li Yibing Song Hao Luo Fan Wang