日付

3年前

サイズ

1.34 MB

データセット構成

論文URL

タグ

E-KAR は、Benchmark for Explainable Knowledge-integral Analogical Reasoning の略で、説明可能な知識集約型の類推推論のベンチマークです。 類似性を認識する能力は人間の認識の基礎です。既存の単語類推テストベンチマークでは、ニューラルモデルにおける類推推論の基礎となるプロセスを明らかにすることはできません。推論可能なモデルは正しい理由に基づいている必要があるという信念に動機付けられ、我々は、最初の知識ベースの説明可能な類推推論ベンチマーク (E-KAR) を提案します。 当社のベンチマークデータセットには、公務員試験からの 1,655 問 (中国語) と 1,251 問 (英語) が含まれています。 これらの問題を解決するには、徹底的な背景知識が必要です。類推推論を実行する必要があるかどうかを説明するフリーテキストの説明スキームを設計し、各質問と回答候補に手動で注釈を付けました。実証結果によると、一部の最先端モデルでは、このベンチマークデータセットは、説明生成タスクと類推質問応答タスクの両方にとって非常に困難です。 これがさらなる研究のきっかけとなった。

E-KAR.torrent

シーディング 0ダウンロード中 2完了 299総ダウンロード数 400

E-KAR/
- README.md
  1.7 KB
- README.txt
  3.39 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

3年前

サイズ

1.34 MB

データセット構成

論文URL

タグ

E-KAR.torrent

シーディング 0ダウンロード中 2完了 299総ダウンロード数 400

E-KAR/
- README.md
  1.7 KB
- README.txt
  3.39 KB

DRACOクロスドメイン深層研究ベンチマークデータセット

2ヶ月前

CHIMERA一般推論合成データセット

9日前

CL-bench コンテキスト学習評価ベンチマークデータセット

4ヶ月前

Nemotron-Math-v2 数学推論データセット

9日前

GroundingME 複雑シーン理解評価データセット

9日前

MCIFマルチモーダルクロスランゲージ指導データセット

6ヶ月前

TxT360-3efforts マルチタスク推論データセット

9日前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

AIでAIを構築

HyperAI Newsletters

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

Command Palette

E-KAR 中国語版 解釈可能な知識集約型類推ベンチマーク

AIでAIを構築

HyperAI Newsletters

Command Palette

E-KAR 中国語版 解釈可能な知識集約型類推ベンチマーク

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

E-KAR 中国語版 解釈可能な知識集約型類推ベンチマーク

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

関連データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

CHIMERA一般推論合成データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

Nemotron-Math-v2 数学推論データセット

GroundingME 複雑シーン理解評価データセット

MCIFマルチモーダルクロスランゲージ指導データセット

TxT360-3efforts マルチタスク推論データセット

E-KAR 中国語版解釈可能な知識集約型類推ベンチマーク

E-KAR 中国語版解釈可能な知識集約型類推ベンチマーク

E-KAR 中国語版解釈可能な知識集約型類推ベンチマーク