Command Palette

Search for a command to run...

TableBench 表格问答基准

日期

1 年前

大小

16.01 MB

机构

University of Waterloo
北京航空航天大学
复旦大学

论文链接

arxiv.org

为了更好地评估 LLM 在表格问答方面的能力,北京航空航天大学、滑铁卢大学、复旦大学和北京信息科技大学的研究团队联合发布了 TableBench 表格问答基准,相关论文成果为「TableBench: A Comprehensive and Complex Benchmark for Table Question Answering」。

TableBench 是一个人工注释的全面而复杂的 TableQA 基准,包含 18 个领域的 886 个样本,旨在促进事实核查、数字推理、数据分析和可视化任务。此外,团队还开源了 TableInstruct 大规模指令语料库,旨在用各种推理方法指导 LLM 。

TableBench.torrent
做种 1正在下载 0已完成 214总下载次数 230
  • TableBench/
    • README.md
      1.4 KB
    • README.txt
      2.8 KB
      • data/
        • dataset.zip
          16.01 MB

用 AI 构建 AI

从想法到上线——通过免费 AI 协同编程、开箱即用的环境和市场最优价格的 GPU 加速您的 AI 开发

AI 协同编程
即用型 GPU
最优价格
立即开始

Hyper Newsletters

订阅我们的最新资讯
我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新
邮件发送服务由 MailChimp 提供