AlgoPuzzleVQA 数据集是由新加坡科技设计大学构建的一个多模态推理数据集,旨在挑战和评估多模态语言模型在解决需要视觉理解、语言理解和复杂算法推理的算法谜题方面的能力。
数据集包含 18 种不同的谜题,涵盖了诸如布尔逻辑、组合学、图论、优化、搜索等多样化的数学和算法主题。该数据集通过自动化的方式从人类编写的代码生成谜题,确保了数据集可以任意扩展推理复杂性和数据集大小。这些谜题都是有确切解决方案的,可以通过算法找到,无需繁琐的人工计算。
AlgoPuzzleVQA 可以作为多模态推理能力的基准测试,用于评估和推动多模态语言模型在解决结合视觉、语言理解和算法推理的复杂问题方面的能力。
做种 1
下载中 0
已完成 24
总下载 58