このデータセットを使用

Discordで議論

日付

2年前

サイズ

29.29 GB

データセット構成

公開URL

Paper URL

タグ

マルチモーダル

Preference Modeling

視覚質問応答

マルチモーダル表現

MMPR（Multimodal Preference Dataset）は、上海人工知能研究所、復旦大学、南京大学、香港中文大学、清華大学、SenseTime Technologyの研究チームが2024年に共同でリリースした大規模なマルチモーダル嗜好データセットの関連論文。結果は「混合優先最適化によるマルチモーダル大規模言語モデルの推論能力の強化”。このデータセットには、明確な正解がない 750,000 サンプルと、明確な正解がある 250 万サンプルが含まれています。サンプルは、多様性を確保するために、VQA、科学、チャート、数学、OCR、ドキュメントなどの複数の分野をカバーしています。データセットを構築する際、研究者らは、特に一般的な VQA およびドキュメントドメインにおけるヒューリスティックルールの制限により、偽陽性の陰性応答を避けるために特別な注意を払いました。このデータセットは、トレーニング中の潜在的な悪影響を回避しながら、マルチモーダル推論タスクにおけるモデルのパフォーマンスを向上させるように設計されています。

MMPR のデータ例。研究チームは、明確な正解がある指示については、複数の解決策をサンプリングし、正解があるものを選択応答として扱い、不正確な答えがあるものを拒否応答として扱う、正しさベースのプロセスを提案しました。研究チームは、明確な正解がない命令については、DropoutNTP を使用して拒否応答を生成することを提案しました。選択応答と拒否応答の違いは斜体で強調されています。赤いハイライトは、間違った応答を示します。

MMPR-OpenGVLab.torrent

シーディング 1ダウンロード中 0完了 152総ダウンロード数 234

MMPR-OpenGVLab/
- README.md
  2.12 KB
- README.txt
  4.25 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

このデータセットを使用

Discordで議論

日付

2年前

サイズ

29.29 GB

データセット構成

公開URL

Paper URL

arxiv.org

タグ

マルチモーダル

Preference Modeling

視覚質問応答

マルチモーダル表現

MMPR（Multimodal Preference Dataset）は、上海人工知能研究所、復旦大学、南京大学、香港中文大学、清華大学、SenseTime Technologyの研究チームが2024年に共同でリリースした大規模なマルチモーダル嗜好データセットの関連論文。結果は「混合優先最適化によるマルチモーダル大規模言語モデルの推論能力の強化”。このデータセットには、明確な正解がない 750,000 サンプルと、明確な正解がある 250 万サンプルが含まれています。サンプルは、多様性を確保するために、VQA、科学、チャート、数学、OCR、ドキュメントなどの複数の分野をカバーしています。データセットを構築する際、研究者らは、特に一般的な VQA およびドキュメントドメインにおけるヒューリスティックルールの制限により、偽陽性の陰性応答を避けるために特別な注意を払いました。このデータセットは、トレーニング中の潜在的な悪影響を回避しながら、マルチモーダル推論タスクにおけるモデルのパフォーマンスを向上させるように設計されています。

MMPR のデータ例。研究チームは、明確な正解がある指示については、複数の解決策をサンプリングし、正解があるものを選択応答として扱い、不正確な答えがあるものを拒否応答として扱う、正しさベースのプロセスを提案しました。研究チームは、明確な正解がない命令については、DropoutNTP を使用して拒否応答を生成することを提案しました。選択応答と拒否応答の違いは斜体で強調されています。赤いハイライトは、間違った応答を示します。

MMPR-OpenGVLab.torrent

シーディング 1ダウンロード中 0完了 152総ダウンロード数 234

MMPR-OpenGVLab/
- README.md
  2.12 KB
- README.txt
  4.25 KB

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています