HyperAIHyperAI

Command Palette

Search for a command to run...

EFM3D: Ein Benchmark zur Messung des Fortschritts hin zu 3D-egozentrischen Foundation-Modellen

Julian Straub Daniel DeTone Tianwei Shen Nan Yang Chris Sweeney Richard Newcombe

Zusammenfassung

Der Aufstieg tragbarer Computer eröffnet eine neue Quelle kontextueller Informationen für KI, die in egozentrischen Sensordaten eingebettet ist. Diese neuen egozentrischen Daten verfügen über detaillierte 3D-Ortungsinformationen und bieten somit die Möglichkeit, eine neue Klasse räumlicher Grundmodelle zu entwickeln, die in der 3D-Raumstruktur verwurzelt sind. Um den Fortschritt bei dem von uns als egozentrische Grundmodelle (Egocentric Foundation Models, EFMs) bezeichneten Bereich zu messen, führen wir EFM3D ein – einen Benchmark mit zwei zentralen Aufgaben der 3D-egozentrischen Wahrnehmung. EFM3D ist der erste Benchmark für die 3D-Objekterkennung und Oberflächenregression an hochwertig annotierten egozentrischen Daten aus dem Projekt Aria. Wir stellen Egocentric Voxel Lifting (EVL) vor, eine Baseline für 3D-EFMs. EVL nutzt alle verfügbaren egozentrischen Modalitäten und übernimmt grundlegende Fähigkeiten aus 2D-Grundmodellen. Dieses Modell, das auf einem großen simulierten Datensatz trainiert wurde, erreicht eine bessere Leistung als bestehende Methoden im EFM3D-Benchmark.


KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren
Sofort einsatzbereite GPUs
Die besten Preise

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
EFM3D: Ein Benchmark zur Messung des Fortschritts hin zu 3D-egozentrischen Foundation-Modellen | Paper | HyperAI