Command Palette

Search for a command to run...

TableBench テーブルの質問と回答のベンチマーク

日付

1年前

サイズ

16.01 MB

組織

ウォータールー大学
北京航空航天大学
復旦大学

論文URL

arxiv.org

テーブル質問応答におけるLLMの能力をより適切に評価するために、北航大学、ウォータールー大学、復旦大学、北京情報科学技術大学の研究チームは共同でTableBenchテーブル質問応答ベンチマークを発表しました。関連する論文結果は「」です。TableBench: テーブルでの質問応答のための包括的かつ複雑なベンチマーク”。

TableBench は、人間が注釈を付けた包括的で洗練された TableQA ベンチマークで、18 ドメインの 886 個のサンプルが含まれており、事実確認、数的推論、データ分析、視覚化タスクを容易にするように設計されています。さらに、チームはさまざまな推論方法で LLM をガイドすることを目的として、TableInstruct 大規模命令コーパスもオープンソース化しました。

TableBench.torrent
シーディング 1ダウンロード中 0ダウンロード完了 214総ダウンロード数 231
  • TableBench/
    • README.md
      1.4 KB
    • README.txt
      2.8 KB
      • data/
        • dataset.zip
          16.01 MB

AI で AI を構築

アイデアからローンチまで — 無料の AI 共同コーディング、すぐに使える環境、最適価格の GPU で AI 開発を加速。

AI 共同コーディング
すぐに使える GPU
最適価格
今すぐ始める

Hyper Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
TableBench テーブルの質問と回答のベンチマーク | データセット | HyperAI超神経