HyperAIHyperAI

Command Palette

Search for a command to run...

TableBench テーブルの質問と回答のベンチマーク

テーブル質問応答におけるLLMの能力をより適切に評価するために、北航大学、ウォータールー大学、復旦大学、北京情報科学技術大学の研究チームは共同でTableBenchテーブル質問応答ベンチマークを発表しました。関連する論文結果は「」です。TableBench: テーブルでの質問応答のための包括的かつ複雑なベンチマーク”。

TableBench は、人間が注釈を付けた包括的で洗練された TableQA ベンチマークで、18 ドメインの 886 個のサンプルが含まれており、事実確認、数的推論、データ分析、視覚化タスクを容易にするように設計されています。さらに、チームはさまざまな推論方法で LLM をガイドすることを目的として、TableInstruct 大規模命令コーパスもオープンソース化しました。

TableBench.torrent
Seeding 1Downloading 0Completed 234Total Downloads 260
  • TableBench/
    • README.md
      1.4 KB
    • README.txt
      2.8 KB
      • data/
        • dataset.zip
          16.01 MB

Build AI with AI

From idea to launch — accelerate your AI development with free AI co-coding, out-of-the-box environment and best price of GPUs.

AI Co-coding
Ready-to-use GPUs
Best Pricing

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています