8ヶ月前

データセット

監視付き微調整

AIインフラストラクチャ

アプローチ／フレームワーク

Nuo Chen†‡ Yan Wang†§ Haiyun Jiang† Deng Cai† Yuhan Li† Ziyang Chen† Longyue Wang† Jia Li†§

概要

近年、ChatGPTやGPT-4などの対話型大規模言語モデル（LLM）は、オープンドメインの対話エージェントを構築する上で大きな可能性を示しています。しかし、これらのエージェントを特定のキャラクターまたは個人に合わせるには、キャラクター表現の複雑さと包括的な注釈の不足という課題が依然として存在します。本論文では、対話エージェントとキャラクターアライメントの研究を進めるために設計された「ハリー・ポッター対話データセット（Harry Potter Dialogue: HPD）」を紹介します。このデータセットは、「ハリー・ポッター」シリーズにおけるすべての対話セッション（英語版および中国語版）を網羅し、対話シーン、発話者、キャラクター間の関係性、属性など重要な背景情報を注釈しています。これらの広範な注釈により、LLMがキャラクタードリブンな対話機能を解錠できる可能性があります。さらに、LLMが特定のキャラクターにどの程度アライメントできるか評価するための普遍的なベンチマークとしても機能できます。私たちはファインチューニングとコンテキスト内学習の両設定でHPD上でLLMをベンチマークしました。評価結果は、高品質でキャラクターにアライメントした応答生成において大幅な改善余地があることを示していますが、提案されたデータセットはモデルをハリー・ポッターらしさのある応答へと導く上で価値があることが確認されました。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

データセット

監視付き微調整

AIインフラストラクチャ

アプローチ／フレームワーク

Nuo Chen†‡ Yan Wang†§ Haiyun Jiang† Deng Cai† Yuhan Li† Ziyang Chen† Longyue Wang† Jia Li†§

概要

近年、ChatGPTやGPT-4などの対話型大規模言語モデル（LLM）は、オープンドメインの対話エージェントを構築する上で大きな可能性を示しています。しかし、これらのエージェントを特定のキャラクターまたは個人に合わせるには、キャラクター表現の複雑さと包括的な注釈の不足という課題が依然として存在します。本論文では、対話エージェントとキャラクターアライメントの研究を進めるために設計された「ハリー・ポッター対話データセット（Harry Potter Dialogue: HPD）」を紹介します。このデータセットは、「ハリー・ポッター」シリーズにおけるすべての対話セッション（英語版および中国語版）を網羅し、対話シーン、発話者、キャラクター間の関係性、属性など重要な背景情報を注釈しています。これらの広範な注釈により、LLMがキャラクタードリブンな対話機能を解錠できる可能性があります。さらに、LLMが特定のキャラクターにどの程度アライメントできるか評価するための普遍的なベンチマークとしても機能できます。私たちはファインチューニングとコンテキスト内学習の両設定でHPD上でLLMをベンチマークしました。評価結果は、高品質でキャラクターにアライメントした応答生成において大幅な改善余地があることを示していますが、提案されたデータセットはモデルをハリー・ポッターらしさのある応答へと導く上で価値があることが確認されました。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

大規模言語モデルとハリー・ポッター：対話エージェントとキャラクターを合わせるための二言語データセット | 記事 | HyperAI超神経