HyperAI超神経

VIRESET ビデオインスタンス編集データセット

ダウンロードヘルプ

このデータセットは、北京大学とOpenBayesベイジアンコンピューティングが2025年にリリースしたビデオインスタンス編集データセットです。関連する論文結果は次のとおりです。VIRES: スケッチとテキストによるガイド生成によるビデオインスタンスの再描画」は、ビデオインスタンスの再描画や時系列のセグメンテーションなどのタスクに正確な注釈サポートを提供することを目的としています。

このデータセットには以下が含まれます。

  • SA-V はマスク注釈を強化し、元の JSON ファイルに新しい masklet_continues フィールドを追加します。これは、base64 デコードと pycocotools.mask ツールによって解析できます。
  • 86,000 本のビデオ クリップ (85,000 本のトレーニング ビデオと 1,000 本の評価ビデオを含む) は、各ビデオが 51 フレームの 24 FPS、512×512 解像度の画像で構成され、一連の構造スケッチと外観のテキスト説明が添付されています。

ビデオ編集の例