日付

2年前

データセット構成

公開URL

ds1000-code-gen.github.io

Paper URL

タグ

DS-1000 は、香港大学、北京大学、その他の大学が 2022 年に共同でリリースしたコード生成分野のベンチマークデータセットです。データサイエンス分野のコード生成タスクに焦点を当てています。関連する論文結果は「」です。DS-1000: データサイエンスコード生成のための自然で信頼性の高いベンチマーク”。このデータセットには、StackOverflow から生成された 1,000 件の実際のデータサイエンスの質問が含まれており、NumPy、Pandas、TensorFlow など、Python で広く使用されている 7 つのデータサイエンスライブラリをカバーしています。質問は現実世界の多様性と実用性を反映しているだけでなく、複数基準の自動評価方法を通じてソリューションの信頼性と正確性を保証します。 DS-1000 は、表面的および意味論的な摂動や困難な書き換えによってモデルがトレーニングデータを単純に記憶することを防ぐことに特別な注意を払って構築されており、正しい答えを提供するにはモデルが質問を真に理解する必要があります。データセットの構造は非常に明確であり、各ライブラリの質問は完了と挿入の 2 つのプロンプト形式で表示され、各質問にはメタ情報、入力データ、参照コード、テストコードなどが含まれています。この設計によりデータセットが作成されます。完全かつ検証可能です。 DS-1000 は、コードの自動補完から教育、学習、パフォーマンス評価まで幅広い応用シナリオがあり、重要な役割を果たします。

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用 Discordで議論

日付

2年前

データセット構成

公開URL

ds1000-code-gen.github.io

Paper URL

タグ

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

DS-1000 コード生成ベンチマーク データ セット

AIでAIを構築

HyperAI Newsletters

Command Palette

DS-1000 コード生成ベンチマーク データ セット

関連データセット

CHOCLO ラテンアメリカ文化ベンチマークデータセット

COCO-2017-ベトナム語画像検出データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

ToolACE 複合ツール学習対話データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RubricHub_v1 マルチドメイン生成タスクデータセット

Nemotron-Personas-Brazil ブラジル合成文字データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

RoVid-X ロボット ビデオ生成データセット

メキシコ糖尿病（メキシコ糖尿病データセット）

MCIFマルチモーダルクロスランゲージ指導データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

DS-1000 コード生成ベンチマーク データ セット

関連データセット

CHOCLO ラテンアメリカ文化ベンチマークデータセット

COCO-2017-ベトナム語画像検出データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

ToolACE 複合ツール学習対話データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RubricHub_v1 マルチドメイン生成タスクデータセット

Nemotron-Personas-Brazil ブラジル合成文字データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

RoVid-X ロボット ビデオ生成データセット

メキシコ糖尿病（メキシコ糖尿病データセット）

MCIFマルチモーダルクロスランゲージ指導データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

CHOCLO ラテンアメリカ文化ベンチマークデータセット

COCO-2017-ベトナム語画像検出データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

ToolACE 複合ツール学習対話データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RubricHub_v1 マルチドメイン生成タスクデータセット

Nemotron-Personas-Brazil ブラジル合成文字データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

RoVid-X ロボット ビデオ生成データセット

メキシコ糖尿病（メキシコ糖尿病データセット）

MCIFマルチモーダルクロスランゲージ指導データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

関連データセット

CHOCLO ラテンアメリカ文化ベンチマークデータセット

COCO-2017-ベトナム語画像検出データセット

DRACOクロスドメイン深層研究ベンチマークデータセット

ToolACE 複合ツール学習対話データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RubricHub_v1 マルチドメイン生成タスクデータセット

Nemotron-Personas-Brazil ブラジル合成文字データセット

CL-bench コンテキスト学習評価ベンチマークデータセット

RoVid-X ロボット ビデオ生成データセット

メキシコ糖尿病（メキシコ糖尿病データセット）

MCIFマルチモーダルクロスランゲージ指導データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

DS-1000 コード生成ベンチマークデータセット

DS-1000 コード生成ベンチマークデータセット

RoVid-X ロボットビデオ生成データセット

DS-1000 コード生成ベンチマークデータセット

RoVid-X ロボットビデオ生成データセット

RoVid-X ロボットビデオ生成データセット

RoVid-X ロボットビデオ生成データセット