MultiBench 大规模多模态学习基准数据集

MultiBench 是一个系统性的且统一的大规模多模态学习基准,涵盖 15 个数据集,10 个模态,20 个预测任务,6 个研究领域。MultiBench 提供自动化的端到端机器学习管道,可简化和标准化数据加载、实验设置和模型评估。为了实现整体评估,MultiBench 提供评…

HotpotQA 问答数据集

HotpotQA 数据集是一个在英文维基百科上收集的大规模问答数据集,包括 11.3 万个众包问题,要回答这些问题,需要参照两篇维基百科文章的介绍段落。每个问题都包含两个黄金段落 (gold paragraph) 以及部分段落中的句子列表,这些句子列表中提供的支持性事实,被认定为…