HyperAIHyperAI

Command Palette

Search for a command to run...

Konsole

EgoThink: Ein Benchmark-Datensatz Zur Visuellen Beantwortung Von Fragen Aus Der Ich-Perspektive

Datum

vor 2 Jahren

Größe

865.29 MB

Organisation

Tsinghua-Universität

Veröffentlichungs-URL

hf-mirror.com

Featured Image

EgoThink ist ein von der Tsinghua-Universität vorgeschlagener Benchmark-Datensatz für visuelle Fragen- und Antwortverfahren aus der Ich-Perspektive.Der Datensatz enthält 700 Bilder, die 6 Kernfunktionen abdecken, die in 12 Dimensionen unterteilt sind. Die Bilder von EgoThink stammen aus den abgetasteten Bildern des Ego4D-Ego-Person-Videodatensatzes. Um die Datenvielfalt zu gewährleisten, werden für jedes Video maximal 2 Bilder abgetastet.

Während des Datensatzerstellungsprozesses wurden nur qualitativ hochwertige Bilder ausgewählt, die das Denken aus der Ich-Perspektive deutlich veranschaulichen. Der Datensatz wird manuell annotiert und enthält in jeder Dimension mindestens 50 detailliert annotierte Frage-Antwort-Fragen. Diese Fragen basieren auf realen Szenen aus mehreren Ich-Perspektiven. EgoThink verfügt über ein breites Anwendungsspektrum, insbesondere bei der Bewertung und Verbesserung der Leistung von VLMs bei Aufgaben aus der Ich-Perspektive, und stellt eine wertvolle Ressource für die zukünftige Forschung im Bereich der verkörperten künstlichen Intelligenz und Robotik dar.

EgoThink.torrent
Seeding 1Wird heruntergeladen 0Abgeschlossen 129Gesamte Downloads 180
  • EgoThink/
    • README.md
      1.56 KB
    • README.txt
      3.12 KB
      • data/
        • EgoThink.zip
          865.29 MB

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-Co-Programmierung
Einsatzbereite GPUs
Bestpreis

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp