CA-1 ヒト嗜好アライメントデータセット
CA-1(Collective Alignment 1)は、OpenAIによって2025年にリリースされました。これは、AIモデルのデフォルト動作に対する人間の価値判断と嗜好に焦点を当てています。モデル生成コンテンツとアノテーターの評価を組み合わせた、人間のフィードバック行動データセットです。
このデータセットは、1,078個のプロンプト比較項目と1,012人の注釈者による18,384件の評価、人口統計情報、および採点根拠で構成されています。集団アライメントの違いの研究、モデル行動規範の誘導、価値感応型報酬メカニズムの開発に適しています。
データ構成:
- プロンプトの比較: 各項目には、合成プロンプトと 4 つの対応する候補応答 (A ~ D) が含まれており、異なる応答間の価値観の違いを比較するために使用されます。
- 注釈者: 年齢、性別、教育レベル、出身国など、各注釈者の基本的な人口統計情報を記録して、さまざまな人々のグループ間の価値観の違いを分析します。
- マージされた比較 - 注釈者: プロンプト、候補者の応答、注釈者の評価、注釈者に関するコンテキスト情報を組み合わせて、完全なプロンプト - 応答 - 評価 - 人口統計マップを作成します。