Date

il y a 10 mois

Organisation

URL du document

Balises

Cet ensemble de données est un ensemble de données de manuels multimodaux publié par Alibaba DAMO Academy en 2025. Les résultats pertinents de l'article sont :2,5 ans en classe : un manuel multimodal pour la préformation visuo-langagière", qui vise à améliorer la pré-formation multimodale et à étendre la capacité du modèle à gérer les entrées visuelles et textuelles entrelacées. L'ensemble de données contient 6,5 millions d'images et 800 millions de données textuelles issues de vidéos pédagogiques. Toutes les images et tous les textes sont extraits de vidéos pédagogiques en ligne (22 000 heures de cours), couvrant six matières fondamentales telles que les mathématiques, la physique et la chimie. Ces données offrent un contexte plus cohérent et des connaissances plus riches pour l'alignement image-texte. Exemple de création d'un ensemble de données à partir d'une vidéo de tutoriel

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 19 jours

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

il y a un mois

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

il y a 20 jours

Ensemble De Données EEG THINGS-EEG

il y a 3 mois

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

il y a 3 mois

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

il y a 3 mois

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

il y a 3 mois

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

il y a 3 mois

Ensemble De Données De Génération Vidéo De Robot RoVid-X

il y a un mois

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

il y a 3 mois

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

il y a 4 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 4 mois

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 4 mois

Ensemble De Données d'inférence Multitâche TxT360-3efforts

il y a 4 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Discuter sur Discord

Date

il y a 10 mois

Organisation

URL du document

arxiv.org

Balises

Multimodal

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 19 jours

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

il y a un mois

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

il y a un mois

Données Sur La Santé Mentale Et l'épuisement Professionnel Des Étudiants

il y a un mois

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

il y a 2 mois

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

il y a 2 mois

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

il y a 20 jours

Ensemble De Données EEG THINGS-EEG

il y a 3 mois

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

il y a 3 mois

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

il y a 3 mois

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

il y a 3 mois

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

il y a 3 mois

Ensemble De Données De Génération Vidéo De Robot RoVid-X

il y a un mois

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

il y a 3 mois

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

il y a 4 mois

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

il y a 4 mois

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

il y a 4 mois

Ensemble De Données d'inférence Multitâche TxT360-3efforts

il y a 4 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Manuel Multimodal - Ensemble De Données De Manuels Multimodaux De 6,5 Millions

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Manuel Multimodal - Ensemble De Données De Manuels Multimodaux De 6,5 Millions

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Données Sur La Santé Mentale Et l'épuisement Professionnel Des Étudiants

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

Ensemble De Données EEG THINGS-EEG

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Manuel Multimodal - Ensemble De Données De Manuels Multimodaux De 6,5 Millions

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Données Sur La Santé Mentale Et l'épuisement Professionnel Des Étudiants

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

Ensemble De Données EEG THINGS-EEG

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Données Sur La Santé Mentale Et l'épuisement Professionnel Des Étudiants

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

Ensemble De Données EEG THINGS-EEG

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI

Nemotron-Personas-Brazil Ensemble De Données De Caractères Synthétiques Brésiliens

Ensemble De Données De Référence Pour l'évaluation De l'apprentissage Contextuel CL-bench

Ensemble De Données De Génération Vidéo De Robot RoVid-X

Ensemble De Données De Transcription De Texte LightOnOCR-mix-0126

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données d'évaluation De La Compréhension De Scènes Complexes De GroundingME

Ensemble De Données MCIF Pour l'instruction Multimodale Interlingue De Suivi

Ensemble De Données d'inférence Multitâche TxT360-3efforts

undefined

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Nemotron Personas France (Ensemble De Données De Personas Synthétiques Français)

Ensemble De Données d'enseignement Et d'entraînement Préalables Sutra 10B

Données Sur La Santé Mentale Et l'épuisement Professionnel Des Étudiants

Ensemble De Données Groundsource Sur Les Événements d'inondation Mondiaux

Ensemble De Données Synthétiques d'inférence Générale CHIMERA

Ensemble De Données De l'Atlas Transcriptionnel Unicellulaire Du Cancer Par scRNA-Seq Pancancéreux

Ensemble De Données EEG THINGS-EEG

Ensemble De Données De Magnétoencéphalographie THINGS-MEG

Ensemble De Données d'imagerie Par Résonance Magnétique Fonctionnelle THINGS-fMRI