日付

2年前

サイズ

509.65 KB

データセット構成

Paper URL

arxiv.org

タグ

サイエンスのためのAI

このデータセットは、最初の科学的大規模モデル Pulco Chemistry Large Model (ChemlLM) とともに、2024 年に上海人工知能研究所によってオープンソース化されました。関連する論文結果は「」です。ChemLLM: 化学大規模言語モデル”。このデータセットには主に ChemBench-4K が含まれており、研究チームはオープンソース化も行っています ChemData700K、ChemPref-10K、および C-MHChem データセットの中国語版と英語版。

研究の背景

大規模な化学パフォーマンスインデックス評価既存の化学タスクパフォーマンスインデックス評価のほとんどは、MoleculeNet などの特定のタスクのエキスパートモデル向けに設計されています。ただし、LLM のテストには適していない可能性があります。既存の化学大規模言語モデルベンチマークの多くは一問一答形式を採用しており、評価基準としてBLEUとROUGEを使用しています。ただし、この種の評価は言語モデルの出力スタイルに大きく影響される可能性があり、科学的事実の正確さが重視されるシナリオには適していません。この場合、事実上の誤りが含まれているにもかかわらず、回答が同様の言語スタイルを示している場合、回答はより高い評価スコアを獲得することさえあります。したがって、研究チームは、現在の主流の評価セットである MMLU 30 および C-Eval と同様の、多肢選択式の質問で構成される化学ベンチマークを構築することを選択しました。

データセットの概要

言語モデルによる化学の理解を厳密に評価するために、研究チームは ChemBench を立ち上げました。これは、化学分子と反応に関する 9 つのタスクで構成され、ChemData のものと同一であり、4,100 を超える多肢選択問題が含まれており、そのうちの 1 つが正解です。答え。このベンチマークは、大規模な言語モデルの化学反応を客観的に測定するための基礎を築きます。 ChemBench のすべてのタスクの分布を図に示します。

他のオープンソースデータセットの紹介

ChemData700K、ChemPref-10K、および C-MHChem データセットの中国語版と英語版を使用するには、ここをクリックしてください

ChemBench-4K データセット

ChemData700K は、700 万個のデータの 1/10 からサンプリングされた 9 つのコア化学タスクと 730K の高品質な質問と回答を含む、大規模な言語モデルの化学能力指示微調整データセットです。このデータセットは幅広い化学ドメインの知識をカバーしており、3 つの主要なタスクカテゴリ (分子、反応、ドメイン) に従っています。

ChemPref-10K データセット

このデータセットは、人間の好みに合わせて言語モデルを最適化するために使用でき、英語版と中国語版の両方で利用できます。

C-MHChem データセット

C-MHChem は、過去 25 年間に中国全土の中学および高校で行われた大学入学試験問題から収集された、完全に手書きで書かれた高品質の多肢選択問題 600 問を含むベンチマークです。

ChemBench4K.torrent

シーディング 1ダウンロード中 0完了 200総ダウンロード数 372

ChemBench4K/
- README.md
  3.08 KB
- README.txt
  6.17 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用

Discordで議論

日付

2年前

サイズ

509.65 KB

データセット構成

Paper URL

arxiv.org

タグ

サイエンスのためのAI

研究の背景

データセットの概要

他のオープンソースデータセットの紹介

ChemData700K、ChemPref-10K、および C-MHChem データセットの中国語版と英語版を使用するには、ここをクリックしてください

ChemBench-4K データセット

ChemPref-10K データセット

このデータセットは、人間の好みに合わせて言語モデルを最適化するために使用でき、英語版と中国語版の両方で利用できます。

C-MHChem データセット

ChemBench4K.torrent

シーディング 1ダウンロード中 0完了 200総ダウンロード数 372

ChemBench4K/
- README.md
  3.08 KB
- README.txt
  6.17 KB

THINGS-EEG EEGデータセット

5ヶ月前

THINGS-MEG磁気脳波データセット

5ヶ月前

THINGS-fMRI機能的磁気共鳴画像データセット

5ヶ月前

RoVid-X ロボットビデオ生成データセット

2ヶ月前

LightOnOCR-mix-0126 テキスト転写データセット

5ヶ月前

RealTimeFaceSwap-10k ビデオ通話なりすましデータセット

5ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

ChemBench4K 化学能力評価ベンチマーク データ セット

研究の背景

データセットの概要

他のオープンソース データセットの紹介

ChemBench-4K データセット

ChemPref-10K データセット

C-MHChem データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

ChemBench4K 化学能力評価ベンチマーク データ セット

研究の背景

データセットの概要

他のオープンソース データセットの紹介

ChemBench-4K データセット

ChemPref-10K データセット

C-MHChem データセット

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

RealTimeFaceSwap-10k ビデオ通話なりすましデータセット

AIでAIを構築

HyperAI Newsletters

Command Palette

ChemBench4K 化学能力評価ベンチマーク データ セット

研究の背景

データセットの概要

他のオープンソース データセットの紹介

ChemBench-4K データセット

ChemPref-10K データセット

C-MHChem データセット

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

RealTimeFaceSwap-10k ビデオ通話なりすましデータセット

AIでAIを構築

HyperAI Newsletters

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

RealTimeFaceSwap-10k ビデオ通話なりすましデータセット

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

RealTimeFaceSwap-10k ビデオ通話なりすましデータセット

ChemBench4K 化学能力評価ベンチマークデータセット

他のオープンソースデータセットの紹介

ChemBench4K 化学能力評価ベンチマークデータセット

他のオープンソースデータセットの紹介

RoVid-X ロボットビデオ生成データセット

ChemBench4K 化学能力評価ベンチマークデータセット

他のオープンソースデータセットの紹介

RoVid-X ロボットビデオ生成データセット

RoVid-X ロボットビデオ生成データセット

RoVid-X ロボットビデオ生成データセット