Discordで議論

日付

4年前

データセット構成

公開URL

tvqa.cs.unc.edu

論文URL

ライセンス

Other

タグ

ビデオ理解

視覚質問応答

マルチモーダル表現

TVQA データセットは大規模なビデオの質問と回答のデータセットであり、ビデオは 6 つの古典的なアメリカの TV シリーズからのものです。このデータセットには、長さ 60 ～ 90 秒の 21.8K のビデオクリップからの約 152.5K の質問と回答のペアが含まれており、合計の長さは 460 時間を超えています。これらの質問と回答のペアは、トレーニング、検証、およびテストセットで 8:1:1 の比率で使用されます。 TVQA データセット内の質問は、質問部分とローカリゼーション部分を含む組み合わせ設計を採用しており、各質問には時間的ローカリゼーションがあります。このような質問に答えるには、モデルがある程度の時間的位置特定と、対話 (字幕) とビデオ (ビデオ) を理解する能力を備えている必要があります。

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Discordで議論

日付

4年前

データセット構成

公開URL

tvqa.cs.unc.edu

論文URL

arxiv.org

ライセンス

Other

タグ

ビデオ理解

視覚質問応答

マルチモーダル表現

TVQA データセットは大規模なビデオの質問と回答のデータセットであり、ビデオは 6 つの古典的なアメリカの TV シリーズからのものです。このデータセットには、長さ 60 ～ 90 秒の 21.8K のビデオクリップからの約 152.5K の質問と回答のペアが含まれており、合計の長さは 460 時間を超えています。これらの質問と回答のペアは、トレーニング、検証、およびテストセットで 8:1:1 の比率で使用されます。 TVQA データセット内の質問は、質問部分とローカリゼーション部分を含む組み合わせ設計を採用しており、各質問には時間的ローカリゼーションがあります。このような質問に答えるには、モデルがある程度の時間的位置特定と、対話 (字幕) とビデオ (ビデオ) を理解する能力を備えている必要があります。

このデータセットはコミュニティユーザーによって提供されており、教育および情報提供のみを目的としています。著作権侵害に関わるコンテンツがある場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています