Date

il y a 8 mois

Organisation

URL du document

2510.15742

Licence

Non-Commercial

Balises

Traitement Du Langage Naturel

Génération De Vidéo

Traitement Vidéo

Ditto-1M est un ensemble de données de montage vidéo piloté par commandes, publié en 2025 par l'Université des sciences et technologies de Hong Kong, Ant Group, l'Université du Zhejiang et d'autres institutions. Les résultats de l'étude sont les suivants :Mise à l'échelle du montage vidéo basé sur les instructions avec un ensemble de données synthétiques de haute qualité", qui vise à promouvoir le développement de modèles de montage vidéo basés sur des instructions en langage naturel, et à améliorer la compréhension du modèle des instructions complexes et la précision de la génération vidéo grâce à des échantillons synthétiques à grande échelle et de haute qualité. Cet ensemble de données contient environ un million de triplet de montage vidéo haute fidélité, chacun composé d'une vidéo source, d'une instruction de montage et de la vidéo montée. Chaque vidéo comporte en moyenne 101 images et une résolution de 1 280 × 720. Les tâches de montage sont divisées en trois catégories :

Transfert de style global : y compris les changements de style artistique, l'étalonnage des couleurs, les effets visuels, etc.
Montage global de forme libre : y compris les modifications de scènes complexes, les changements environnementaux, les transformations créatives, etc.
Édition locale : comprend la modification précise des objets, les changements d'attributs, les ajustements locaux, etc.
Exemple d'ensemble de données

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

il y a 2 mois

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

il y a 5 mois

Ensemble De Données De Génération Vidéo De Robot RoVid-X

il y a 2 mois

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

il y a 5 mois

Ensemble De Données Global Green Energy Pulse

il y a 5 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 6 mois

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 6 mois

Ensemble De Données d'inférence Multitâche TxT360-3efforts

il y a 6 mois

Ensemble De Données De Détection De Contrebande Par Rayons X

il y a 6 mois

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

il y a 6 mois

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

il y a 6 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Discuter sur Discord

Date

il y a 8 mois

Organisation

URL du document

2510.15742

Licence

Non-Commercial

Balises

Traitement Du Langage Naturel

Génération De Vidéo

Traitement Vidéo

Transfert de style global : y compris les changements de style artistique, l'étalonnage des couleurs, les effets visuels, etc.
Montage global de forme libre : y compris les modifications de scènes complexes, les changements environnementaux, les transformations créatives, etc.
Édition locale : comprend la modification précise des objets, les changements d'attributs, les ajustements locaux, etc.
Exemple d'ensemble de données

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De Montage Vidéo Piloté Par Les Instructions Ditto-1M

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Montage Vidéo Piloté Par Les Instructions Ditto-1M

undefined

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données Global Green Energy Pulse

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Détection De Contrebande Par Rayons X

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Montage Vidéo Piloté Par Les Instructions Ditto-1M

undefined

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données Global Green Energy Pulse

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Détection De Contrebande Par Rayons X

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données Global Green Energy Pulse

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Détection De Contrebande Par Rayons X

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro

undefined

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données De Tâches Génératives multi-domaines RubricHub_v1

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données Global Green Energy Pulse

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Ensemble De Données De Détection De Contrebande Par Rayons X

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Ensemble De Données d'évaluation Complète En Contexte Long LongBench-Pro