Date

il y a 7 mois

URL du document

Licence

Apache 2.0

Balises

L'ensemble de données AutoCaption est un ensemble de données de référence de sous-titrage vidéo publié par Tjunlp Lab en 2025. Les résultats de l'article associé sont «Évaluation de modèles linguistiques multimodaux de grande taille pour le sous-titrage vidéo via la recherche arborescente de Monte-Carlo", qui vise à promouvoir la recherche de grands modèles linguistiques multimodaux dans le domaine de la génération de sous-titres vidéo.

Structure du jeu de données :

L'ensemble de données contient 2 sous-ensembles, avec un total de 11 184 échantillons :

sft_data : réglage fin supervisé pour les modèles de sous-titres (9 419 échantillons pour les données de réglage fin supervisé)
mcts_vcb : évalué à l'aide des légendes et des points clés générés par MCTS (1 765 échantillons pour évaluer le benchmark MCTS-VCB)

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

Associé Jeux de données

Ensemble De Données d'évaluation Des Tâches De Recherche Inférentielle De FrontierScience

il y a 2 mois

Ensemble De Données d'évaluation Du Modèle De Récompense Vidéo VideoRewardBench

il y a 2 mois

Ensemble De Données De Référence OST-Bench Pour La Compréhension De Scènes spatio-temporelles

il y a 3 mois

25.58 GB60

Ensemble De Données VAP-Data Sur Les Performances Des Actions Visuelles

il y a 2 mois

Ensemble De Données De Mouvements De Danse Pilotés Par l'image X-Dance

il y a 2 mois

147.3 MB75

Ensemble De Données INFINITY-CHAT Pour La Réponse À Des Questions Ouvertes Réelles

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Discuter sur Discord

Date

il y a 7 mois

URL du document

arxiv.org

Licence

Apache 2.0

Balises

Génération De Texte

Structure du jeu de données :

L'ensemble de données contient 2 sous-ensembles, avec un total de 11 184 échantillons :

sft_data : réglage fin supervisé pour les modèles de sous-titres (9 419 échantillons pour les données de réglage fin supervisé)
mcts_vcb : évalué à l'aide des légendes et des points clés générés par MCTS (1 765 échantillons pour évaluer le benchmark MCTS-VCB)

Associé Jeux de données

Ensemble De Données d'évaluation Des Tâches De Recherche Inférentielle De FrontierScience

il y a 2 mois

Ensemble De Données d'évaluation Du Modèle De Récompense Vidéo VideoRewardBench

il y a 2 mois

Ensemble De Données De Référence OST-Bench Pour La Compréhension De Scènes spatio-temporelles

il y a 3 mois

25.58 GB60

Ensemble De Données VAP-Data Sur Les Performances Des Actions Visuelles

il y a 2 mois

Ensemble De Données De Mouvements De Danse Pilotés Par l'image X-Dance

il y a 2 mois

147.3 MB75

Ensemble De Données INFINITY-CHAT Pour La Réponse À Des Questions Ouvertes Réelles

il y a 2 mois

Ensemble De Données d'évaluation De La Génération d'écriture Arena-Write

il y a 2 mois

Ensemble De Données De Résultats d'amarrage AutoDock-GPU_Output

il y a 3 mois

Ensemble De Données De Tests Physiologiques PhysDriver

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De Référence Sur Les sous-titres Vidéo AutoCaption

Structure du jeu de données :

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Référence Sur Les sous-titres Vidéo AutoCaption

Structure du jeu de données :

Associé Jeux de données

Ensemble De Données d'évaluation Des Tâches De Recherche Inférentielle De FrontierScience

Ensemble De Données d'évaluation Du Modèle De Récompense Vidéo VideoRewardBench

Ensemble De Données De Référence OST-Bench Pour La Compréhension De Scènes spatio-temporelles

Ensemble De Données VAP-Data Sur Les Performances Des Actions Visuelles

Ensemble De Données De Mouvements De Danse Pilotés Par l'image X-Dance

Ensemble De Données INFINITY-CHAT Pour La Réponse À Des Questions Ouvertes Réelles

Ensemble De Données d'évaluation De La Génération d'écriture Arena-Write

Ensemble De Données De Résultats d'amarrage AutoDock-GPU_Output

Ensemble De Données De Tests Physiologiques PhysDriver

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Référence Sur Les sous-titres Vidéo AutoCaption

Structure du jeu de données :

Associé Jeux de données

Ensemble De Données d'évaluation Des Tâches De Recherche Inférentielle De FrontierScience

Ensemble De Données d'évaluation Du Modèle De Récompense Vidéo VideoRewardBench

Ensemble De Données De Référence OST-Bench Pour La Compréhension De Scènes spatio-temporelles

Ensemble De Données VAP-Data Sur Les Performances Des Actions Visuelles

Ensemble De Données De Mouvements De Danse Pilotés Par l'image X-Dance

Ensemble De Données INFINITY-CHAT Pour La Réponse À Des Questions Ouvertes Réelles

Ensemble De Données d'évaluation De La Génération d'écriture Arena-Write

Ensemble De Données De Résultats d'amarrage AutoDock-GPU_Output

Ensemble De Données De Tests Physiologiques PhysDriver

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Jeux de données

Ensemble De Données d'évaluation Des Tâches De Recherche Inférentielle De FrontierScience

Ensemble De Données d'évaluation Du Modèle De Récompense Vidéo VideoRewardBench

Ensemble De Données De Référence OST-Bench Pour La Compréhension De Scènes spatio-temporelles

Ensemble De Données VAP-Data Sur Les Performances Des Actions Visuelles

Ensemble De Données De Mouvements De Danse Pilotés Par l'image X-Dance

Ensemble De Données INFINITY-CHAT Pour La Réponse À Des Questions Ouvertes Réelles

Ensemble De Données d'évaluation De La Génération d'écriture Arena-Write

Ensemble De Données De Résultats d'amarrage AutoDock-GPU_Output

Ensemble De Données De Tests Physiologiques PhysDriver

Associé Jeux de données

Ensemble De Données d'évaluation Des Tâches De Recherche Inférentielle De FrontierScience

Ensemble De Données d'évaluation Du Modèle De Récompense Vidéo VideoRewardBench

Ensemble De Données De Référence OST-Bench Pour La Compréhension De Scènes spatio-temporelles

Ensemble De Données VAP-Data Sur Les Performances Des Actions Visuelles

Ensemble De Données De Mouvements De Danse Pilotés Par l'image X-Dance

Ensemble De Données INFINITY-CHAT Pour La Réponse À Des Questions Ouvertes Réelles

Ensemble De Données d'évaluation De La Génération d'écriture Arena-Write

Ensemble De Données De Résultats d'amarrage AutoDock-GPU_Output

Ensemble De Données De Tests Physiologiques PhysDriver