@article{qin2025humansense, title={HumanSense: From Multimodal Perception to Empathetic Context-Aware Responses through Reasoning MLLMs}, author={Qin, Zheng and Zheng, Ruobing and Wang, Yabing and Li, Tianqi and Yuan, Yi and Chen, Jingdong and Wang, Le}, journal={arXiv preprint arXiv:2508.10576}, year={2025} }

Utiliser ce jeu de données Discuter sur Discord

Date

il y a 7 mois

Organisation

Balises

Multimodal

Traitement Du Langage Naturel

Reconnaissance D'action

Reconnaissance Des Émotions

Interaction Homme-Machine

Compréhension Vidéo

HumanSense Benchmark est un ensemble de données de référence pour l'évaluation de la perception humaine, publié en 2025 par l'Université Jiaotong de Xi'an en collaboration avec Ant Group. L'article de recherche associé s'intitule « HumanSense : De la perception multimodale aux réponses empathiques et contextuelles grâce aux modèles linéaires multimodaux de raisonnementL'objectif est de mesurer de manière exhaustive les capacités interactives réelles du modèle, en intégrant des informations multimodales telles que la vision, l'audio et le texte. Cet ensemble de données contient 3 291 questions vidéo et 591 questions audio, couvrant 15 tâches de difficulté croissante. La structure des tâches est une pyramide à quatre niveaux :

Couches de perception L1–L2 : capacités perceptives fondamentales et complexes pour la vision, l’audio et la perception intermodale ;
Niveau de compréhension L3 : La capacité à comprendre les relations implicites, les émotions et les états en fonction des situations interactives ;
Couche de réponse L4 : Capacités de réponse stratégiques et contextualisées dans des scénarios interactifs. Ce jeu de données construit des questions à partir de vidéos, d'enregistrements audio et de dialogues multimodaux réels. Généré grâce à divers jeux de données open source et à des enregistrements de scènes réelles, il couvre un large éventail de tâches d'interaction centrées sur l'humain, de la reconnaissance d'apparence et d'émotions à la compréhension des relations et au dialogue psychologique. Il constitue l'un des bancs d'essai d'évaluation multimodale actuels les plus proches des scénarios de communication humaine réelle.
Distribution des ensembles de données

Citation

@article{qin2025humansense,
title={HumanSense: From Multimodal Perception to Empathetic Context-Aware Responses through Reasoning MLLMs},
author={Qin, Zheng and Zheng, Ruobing and Wang, Yabing and Li, Tianqi and Yuan, Yi and Chen, Jingdong and Wang, Le},
journal={arXiv preprint arXiv:2508.10576},
year={2025}
}

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

il y a 36 minutes

Ensemble De Données d'extraction De Preuves De Condition De Requête Verbatim Spans

dans 6 heures

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

il y a 18 jours

Ensemble De Données Parallèles De Traduction Multilingue SMOL

il y a 19 jours

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

il y a 6 jours

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

il y a 19 jours

Ensemble De Données De Référence Multimodal À Contexte Long MemLens

il y a 19 jours

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

il y a un mois

Ensemble De Données De Référence En Monde Réel Claw-Eval

il y a un mois

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

il y a un jour

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

il y a 2 mois

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

il y a 2 mois

Ensemble De Données BRIGHT Pour l'évaluation Des Bâtiments Sinistrés

il y a un jour

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

il y a un jour

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

il y a un jour

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

il y a 2 mois

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données Discuter sur Discord

Date

il y a 7 mois

Organisation

Balises

Multimodal

Traitement Du Langage Naturel

Reconnaissance D'action

Reconnaissance Des Émotions

Interaction Homme-Machine

Compréhension Vidéo

Couches de perception L1–L2 : capacités perceptives fondamentales et complexes pour la vision, l’audio et la perception intermodale ;
Niveau de compréhension L3 : La capacité à comprendre les relations implicites, les émotions et les états en fonction des situations interactives ;
Couche de réponse L4 : Capacités de réponse stratégiques et contextualisées dans des scénarios interactifs. Ce jeu de données construit des questions à partir de vidéos, d'enregistrements audio et de dialogues multimodaux réels. Généré grâce à divers jeux de données open source et à des enregistrements de scènes réelles, il couvre un large éventail de tâches d'interaction centrées sur l'humain, de la reconnaissance d'apparence et d'émotions à la compréhension des relations et au dialogue psychologique. Il constitue l'un des bancs d'essai d'évaluation multimodale actuels les plus proches des scénarios de communication humaine réelle.
Distribution des ensembles de données

Citation

@article{qin2025humansense,
title={HumanSense: From Multimodal Perception to Empathetic Context-Aware Responses through Reasoning MLLMs},
author={Qin, Zheng and Zheng, Ruobing and Wang, Yabing and Li, Tianqi and Yuan, Yi and Chen, Jingdong and Wang, Le},
journal={arXiv preprint arXiv:2508.10576},
year={2025}
}

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

il y a 36 minutes

Ensemble De Données d'extraction De Preuves De Condition De Requête Verbatim Spans

dans 6 heures

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

dans 3 heures

Nemotron-SFT-Math-v4 Jeu De Données SFT Pour l'inférence Mathématique

il y a 36 minutes

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

il y a 18 jours

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

il y a 18 jours

Ensemble De Données Parallèles De Traduction Multilingue SMOL

il y a 19 jours

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

il y a 6 jours

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

il y a 19 jours

Ensemble De Données De Référence Multimodal À Contexte Long MemLens

il y a 19 jours

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

il y a un mois

Ensemble De Données De Référence En Monde Réel Claw-Eval

il y a un mois

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

il y a un jour

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

il y a 2 mois

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

il y a 2 mois

Ensemble De Données BRIGHT Pour l'évaluation Des Bâtiments Sinistrés

il y a un jour

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

il y a un jour

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

il y a un jour

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

il y a 2 mois

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

il y a 2 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Ensemble De Données De Référence HumanSense

Citation

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Référence HumanSense

Citation

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données d'extraction De Preuves De Condition De Requête Verbatim Spans

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

Nemotron-SFT-Math-v4 Jeu De Données SFT Pour l'inférence Mathématique

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Ensemble De Données Parallèles De Traduction Multilingue SMOL

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données De Référence Multimodal À Contexte Long MemLens

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données BRIGHT Pour l'évaluation Des Bâtiments Sinistrés

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Ensemble De Données De Référence HumanSense

Citation

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données d'extraction De Preuves De Condition De Requête Verbatim Spans

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

Nemotron-SFT-Math-v4 Jeu De Données SFT Pour l'inférence Mathématique

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Ensemble De Données Parallèles De Traduction Multilingue SMOL

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données De Référence Multimodal À Contexte Long MemLens

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données BRIGHT Pour l'évaluation Des Bâtiments Sinistrés

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL

Ensemble De Données d'extraction De Preuves De Condition De Requête Verbatim Spans

Ensemble De Données De Reconstruction d'objets 3D Pour Artistes SAM 3D

Nemotron-SFT-Math-v4 Jeu De Données SFT Pour l'inférence Mathématique

Graphique ChartNet : Compréhension Des Ensembles De Données Multimodaux

Ensemble De Données EAVSD Sur Les Storyboards Vidéo Publicitaires Pour Le Commerce Électronique

Ensemble De Données Parallèles De Traduction Multilingue SMOL

Ensemble De Données d'évaluation Comparative Des Agents Intelligents Médicaux chi-bench

Ensemble De Données ViMU Sur La Compréhension Des Métaphores Vidéo

Ensemble De Données De Référence Multimodal À Contexte Long MemLens

Ensemble De Données De Référence Multimodal MathNet Pour l'inférence Mathématique

Ensemble De Données De Référence En Monde Réel Claw-Eval

Ensemble De Données De Référence Pour La Compréhension Des Changements De Zone Par Télédétection RSRCC

Ensemble De Données d'amélioration De La Netteté Pancolor Par Télédétection À Grande Échelle

Ensemble De Données d'évaluation Des Capacités d'analyse Syntaxique De Documents ParseBench

Ensemble De Données BRIGHT Pour l'évaluation Des Bâtiments Sinistrés

Ensemble De Données d'évaluation Des Capacités d'analyse Multimodale d'OmniParsingBench

Ensemble De Données De Référence Pour l'analyse Syntaxique Multilingue De Documents MDPBench

Ensemble De Données De Raisonnement Étape Par Étape GPT-5.4

Ensemble De Données De Référence Pour La Recherche Approfondie Interdisciplinaire DRACO

undefined

Ensemble De Données d'évaluation Des Connaissances Culturelles Multilingues De MAKIEVAL