HyperAI

主区域

GPU

控制台
Studio
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务协议隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
SOTA
零样本视频问答

零样本视频问答

Zero-Shot Video Question Answer任务旨在评估大语言模型在未见过的具体视频数据上回答问题的能力。该任务属于推理范畴，通过分析视频内容并生成准确的回答，以提升模型在多模态理解与交互中的应用价值。

BT-Adapter (zero-shot)

EgoSchema (fullset)

BIMBA-LLaVA-Qwen2-7B

EgoSchema (subset)

FrozenBiLM (with speech)

Video-MME (w/o subs)

Video-RAG (based on LLaVA-Video)

Zero-shot Video Question Answering on LongVideoBench

CinePile: A Long Video Question Answering Dataset and Benchmark

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们帮助与支持数据集支持

产品

报道论文教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili

HyperAI

主区域

GPU

控制台
Studio
文档
价格

Pulse

报道

资源

论文
教程
数据集
百科

基准测试

SOTA
大语言模型（LLM）
GPU 排行榜

社区

活动

实用工具

关于服务协议隐私政策
中文

Command Palette

Search for a command to run...

HyperAI
SOTA
零样本视频问答

零样本视频问答

Zero-Shot Video Question Answer任务旨在评估大语言模型在未见过的具体视频数据上回答问题的能力。该任务属于推理范畴，通过分析视频内容并生成准确的回答，以提升模型在多模态理解与交互中的应用价值。

BT-Adapter (zero-shot)

EgoSchema (fullset)

BIMBA-LLaVA-Qwen2-7B

EgoSchema (subset)

FrozenBiLM (with speech)

Video-MME (w/o subs)

Video-RAG (based on LLaVA-Video)

Zero-shot Video Question Answering on LongVideoBench

CinePile: A Long Video Question Answering Dataset and Benchmark

学习、理解、实践，与社区一起构建人工智能的未来

关于

关于我们帮助与支持数据集支持

产品

报道论文教程数据集百科

链接

TVM 中文 Apache TVM

© HyperAI

津ICP备17010941号-1

京公网安备11010502038810号

GitHub Discord X (formerly Twitter)Bilibili