HyperAI

Discordで議論

日付

1年前

Paper URL

arxiv.org

ライセンス

Apache 2.0

タグ

テキスト生成

AutoCaptionデータセットは、2025年にTjunlp Labによってリリースされたビデオキャプションのベンチマークデータセットです。関連する論文の結果は次のとおりです。モンテカルロ木探索によるビデオキャプションにおけるマルチモーダル大規模言語モデルの評価」は、ビデオ字幕生成の分野におけるマルチモーダル大規模言語モデルの研究を促進することを目的としています。

データセットの構造:

データセットには 2 つのサブセットが含まれており、合計 11,184 個のサンプルがあります。

sft_data: 字幕モデルの教師あり微調整（教師あり微調整データのサンプル数は 9,419 個）
mcts_vcb: MCTSで生成されたキャプションとキーポイントを使用して評価（MCTS-VCBベンチマークを評価するための1,765サンプル）

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

Discordで議論

日付

1年前

Paper URL

arxiv.org

ライセンス

Apache 2.0

タグ

テキスト生成

データセットの構造:

データセットには 2 つのサブセットが含まれており、合計 11,184 個のサンプルがあります。

sft_data: 字幕モデルの教師あり微調整（教師あり微調整データのサンプル数は 9,419 個）
mcts_vcb: MCTSで生成されたキャプションとキーポイントを使用して評価（MCTS-VCBベンチマークを評価するための1,765サンプル）

THINGS-EEG EEGデータセット

5ヶ月前

THINGS-MEG磁気脳波データセット

5ヶ月前

THINGS-fMRI機能的磁気共鳴画像データセット

5ヶ月前

RubricHub_v1 マルチドメイン生成タスクデータセット

5ヶ月前

RoVid-X ロボットビデオ生成データセット

2ヶ月前

LightOnOCR-mix-0126 テキスト転写データセット

5ヶ月前

TransPhy3D 透明反射合成ビデオデータセット

5ヶ月前

MCIFマルチモーダルクロスランゲージ指導データセット

6ヶ月前

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

6ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

AutoCaption ビデオキャプションベンチマークデータセット

データセットの構造:

AIでAIを構築

HyperAI Newsletters

Command Palette

AutoCaption ビデオキャプションベンチマークデータセット

データセットの構造:

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RubricHub_v1 マルチドメイン生成タスクデータセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

TransPhy3D 透明反射合成ビデオデータセット

MCIFマルチモーダルクロスランゲージ指導データセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

AIでAIを構築

HyperAI Newsletters

Command Palette

AutoCaption ビデオキャプションベンチマークデータセット

データセットの構造:

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RubricHub_v1 マルチドメイン生成タスクデータセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

TransPhy3D 透明反射合成ビデオデータセット

MCIFマルチモーダルクロスランゲージ指導データセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

AIでAIを構築

HyperAI Newsletters

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RubricHub_v1 マルチドメイン生成タスクデータセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

TransPhy3D 透明反射合成ビデオデータセット

MCIFマルチモーダルクロスランゲージ指導データセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

関連データセット

THINGS-EEG EEGデータセット

THINGS-MEG磁気脳波データセット

THINGS-fMRI機能的磁気共鳴画像データセット

RubricHub_v1 マルチドメイン生成タスクデータセット

RoVid-X ロボット ビデオ生成データセット

LightOnOCR-mix-0126 テキスト転写データセット

TransPhy3D 透明反射合成ビデオデータセット

MCIFマルチモーダルクロスランゲージ指導データセット

MCD-rPPGマルチカメラ遠隔光電式容積脈波記録データセット

RoVid-X ロボットビデオ生成データセット

RoVid-X ロボットビデオ生成データセット

RoVid-X ロボットビデオ生成データセット

RoVid-X ロボットビデオ生成データセット