HyperAI

Startseite

GPU

Konsole
Doku

Aktuelles

Neuigkeiten

Ressourcen

Dokumente
Notizbücher
Datensätze
Wiki

Leistungstests

Stand der Technik
LLM-Modelle
GPU-Rangliste

Community

Veranstaltungen

Dienstprogramm

Info Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
SOTA
Zero-Shot-Videofragebeantwortung

Zero-Shot-Videofragebeantwortung

Die Aufgabe des Zero-Shot Video Frage-Antwortens zielt darauf ab, die Fähigkeit großer Sprachmodelle zu bewerten, Fragen zu spezifischen Videodaten zu beantworten, die sie noch nie gesehen haben. Diese Aufgabe gehört zur Kategorie der Inferenz, bei der das Modell den Inhalt des Videos analysiert und präzise Antworten generiert, was seinen Anwendungswert im Bereich der multimodalen Verarbeitung und Interaktion erhöht.

BT-Adapter (zero-shot)

EgoSchema (fullset)

BIMBA-LLaVA-Qwen2-7B

EgoSchema (subset)

FrozenBiLM (with speech)

Video-MME (w/o subs)

Video-RAG (based on LLaVA-Video)

Zero-shot Video Question Answering on LongVideoBench

CinePile: A Long Video Question Answering Dataset and Benchmark

Die Zukunft der künstlichen Intelligenz aufbauen

Über

Über uns Datensatz-Hilfe

Produkte

Neuigkeiten Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)

HyperAI

Startseite

GPU

Konsole
Doku

Aktuelles

Neuigkeiten

Ressourcen

Dokumente
Notizbücher
Datensätze
Wiki

Leistungstests

Stand der Technik
LLM-Modelle
GPU-Rangliste

Community

Veranstaltungen

Dienstprogramm

Info Nutzungsbedingungen Datenschutzerklärung
Deutsch

Command Palette

Search for a command to run...

HyperAI
SOTA
Zero-Shot-Videofragebeantwortung

Zero-Shot-Videofragebeantwortung

Die Aufgabe des Zero-Shot Video Frage-Antwortens zielt darauf ab, die Fähigkeit großer Sprachmodelle zu bewerten, Fragen zu spezifischen Videodaten zu beantworten, die sie noch nie gesehen haben. Diese Aufgabe gehört zur Kategorie der Inferenz, bei der das Modell den Inhalt des Videos analysiert und präzise Antworten generiert, was seinen Anwendungswert im Bereich der multimodalen Verarbeitung und Interaktion erhöht.

BT-Adapter (zero-shot)

EgoSchema (fullset)

BIMBA-LLaVA-Qwen2-7B

EgoSchema (subset)

FrozenBiLM (with speech)

Video-MME (w/o subs)

Video-RAG (based on LLaVA-Video)

Zero-shot Video Question Answering on LongVideoBench

CinePile: A Long Video Question Answering Dataset and Benchmark

Die Zukunft der künstlichen Intelligenz aufbauen

Über

Über uns Datensatz-Hilfe

Produkte

Neuigkeiten Notebooks Datensätze Wiki

Links

© HyperAI

GitHub Discord X (formerly Twitter)