日付

10ヶ月前

データセット構成

ライセンス

CC BY 4.0

タグ

LLM

Preference Modeling

ベンチマーク

CA-1（Collective Alignment 1）は、OpenAIによって2025年にリリースされました。これは、AIモデルのデフォルト動作に対する人間の価値判断と嗜好に焦点を当てています。モデル生成コンテンツとアノテーターの評価を組み合わせた、人間のフィードバック行動データセットです。このデータセットは、1,078個のプロンプト比較項目と1,012人の注釈者による18,384件の評価、人口統計情報、および採点根拠で構成されています。集団アライメントの違いの研究、モデル行動規範の誘導、価値感応型報酬メカニズムの開発に適しています。

データ構成:

プロンプトの比較: 各項目には、合成プロンプトと 4 つの対応する候補応答 (A ～ D) が含まれており、異なる応答間の価値観の違いを比較するために使用されます。
注釈者: 年齢、性別、教育レベル、出身国など、各注釈者の基本的な人口統計情報を記録して、さまざまな人々のグループ間の価値観の違いを分析します。
マージされた比較 - 注釈者: プロンプト、候補者の応答、注釈者の評価、注釈者に関するコンテキスト情報を組み合わせて、完全なプロンプト - 応答 - 評価 - 人口統計マップを作成します。

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このデータセットを使用 Discordで議論

日付

10ヶ月前

データセット構成

ライセンス

CC BY 4.0

タグ

LLM

Preference Modeling

ベンチマーク

データ構成:

プロンプトの比較: 各項目には、合成プロンプトと 4 つの対応する候補応答 (A ～ D) が含まれており、異なる応答間の価値観の違いを比較するために使用されます。
注釈者: 年齢、性別、教育レベル、出身国など、各注釈者の基本的な人口統計情報を記録して、さまざまな人々のグループ間の価値観の違いを分析します。
マージされた比較 - 注釈者: プロンプト、候補者の応答、注釈者の評価、注釈者に関するコンテキスト情報を組み合わせて、完全なプロンプト - 応答 - 評価 - 人口統計マップを作成します。

地上情報源による世界洪水イベントデータセット

3ヶ月前

CL-bench コンテキスト学習評価ベンチマークデータセット

4ヶ月前

TransPhy3D 透明反射合成ビデオデータセット

5ヶ月前

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

6ヶ月前

LongBench-Pro ロングコンテキスト包括的評価データセット

6ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

データ構成:

AIでAIを構築

HyperAI Newsletters

データ構成:

関連データセット

地上情報源による世界洪水イベントデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

TransPhy3D 透明反射合成ビデオデータセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

データ構成:

関連データセット

地上情報源による世界洪水イベントデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

TransPhy3D 透明反射合成ビデオデータセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

TransPhy3D 透明反射合成ビデオデータセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

関連データセット

地上情報源による世界洪水イベントデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

TransPhy3D 透明反射合成ビデオデータセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

Command Palette

CA-1 ヒト嗜好アライメントデータセット

データ構成:

AIでAIを構築

HyperAI Newsletters

Command Palette

CA-1 ヒト嗜好アライメントデータセット

データ構成:

関連データセット

地上情報源による世界洪水イベントデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

TransPhy3D 透明反射合成ビデオデータセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

CA-1 ヒト嗜好アライメントデータセット

データ構成:

関連データセット

地上情報源による世界洪水イベントデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

TransPhy3D 透明反射合成ビデオデータセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

地上情報源による世界洪水イベントデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

TransPhy3D 透明反射合成ビデオデータセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

LongBench-Pro ロングコンテキスト包括的評価データセット

関連データセット

地上情報源による世界洪水イベントデータセット

CL-bench コンテキスト学習評価ベンチマークデータセット

TransPhy3D 透明反射合成ビデオデータセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

LongBench-Pro ロングコンテキスト包括的評価データセット