@article{qin2025humansense, title={HumanSense: From Multimodal Perception to Empathetic Context-Aware Responses through Reasoning MLLMs}, author={Qin, Zheng and Zheng, Ruobing and Wang, Yabing and Li, Tianqi and Yuan, Yi and Chen, Jingdong and Wang, Le}, journal={arXiv preprint arXiv:2508.10576}, year={2025} }

Diesen Datensatz verwenden Auf Discord diskutieren

Datum

vor 7 Monaten

Organisation

Tags

Multimodal

Natürliche Sprachverarbeitung

Aktionserkennung

Emotionserkennung

Mensch-Computer-Interaktion

Videobegreifen

HumanSense Benchmark ist ein Benchmark-Datensatz zur Bewertung der menschlichen Wahrnehmung, der 2025 von der Xi'an Jiaotong Universität in Zusammenarbeit mit der Ant Group veröffentlicht wurde. Die zugehörige Forschungsarbeit trägt den Titel „HumanSense: Von multimodaler Wahrnehmung zu empathischen, kontextsensitiven Reaktionen durch logisches MLLMsZiel ist es, die interaktiven Fähigkeiten des Modells in der realen Welt unter der Fusion multimodaler Informationen wie Bild, Ton und Text umfassend zu messen. Dieser Datensatz enthält 3.291 videobasierte und 591 audiobasierte Fragen, die 15 Aufgaben mit steigendem Schwierigkeitsgrad abdecken. Die Aufgabenstruktur ist eine vierstufige Pyramide, bestehend aus:

L1–L2-Wahrnehmungsschichten: Fundamentale und komplexe Wahrnehmungsfähigkeiten für Sehen, Hören und intermodale Wahrnehmung;
L3-Verständnisebene: Die Fähigkeit, implizite Beziehungen, Emotionen und Zustände auf der Grundlage interaktiver Situationen zu verstehen;
L4-Reaktionsschicht: Strategische und kontextbezogene Reaktionsfähigkeiten in interaktiven Szenarien. Dieser Datensatz generiert Fragen aus realen Videos, Audioaufnahmen und multimodalen Dialogen. Er basiert auf verschiedenen Open-Source-Datensätzen und Aufnahmen realer Szenen und deckt ein breites Spektrum an Aufgaben der nutzerzentrierten Interaktion ab – von der Erkennung von Aussehen und Emotionen bis hin zum Beziehungsverständnis und psychologischen Dialogen. Er zählt zu den aktuellen Benchmarks für multimodale Evaluierung und bildet reale menschliche Kommunikationsszenarien besonders gut ab.
Datenverteilung

Zitat

@article{qin2025humansense,
title={HumanSense: From Multimodal Perception to Empathetic Context-Aware Responses through Reasoning MLLMs},
author={Qin, Zheng and Zheng, Ruobing and Wang, Yabing and Li, Tianqi and Yuan, Yi and Chen, Jingdong and Wang, Le},
journal={arXiv preprint arXiv:2508.10576},
year={2025}
}

Dieser Datensatz wurde von Community-Nutzern beigesteuert und dient ausschließlich Bildungs- und Informationszwecken. Falls Inhalte eine Urheberrechtsverletzung darstellen, kontaktieren Sie uns bitte unter [email protected] zur umgehenden Prüfung und Entfernung.

Zugehörige Datensätze

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

HyperAI

Diesen Datensatz verwenden Auf Discord diskutieren

Datum

vor 7 Monaten

Organisation

Zitat

@article{qin2025humansense,
title={HumanSense: From Multimodal Perception to Empathetic Context-Aware Responses through Reasoning MLLMs},
author={Qin, Zheng and Zheng, Ruobing and Wang, Yabing and Li, Tianqi and Yuan, Yi and Chen, Jingdong and Wang, Le},
journal={arXiv preprint arXiv:2508.10576},
year={2025}
}

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

vor 10 Minuten

Wörtliche Spannen Abfragebedingungs-Evidenz-Extraktionsdatensatz

in 6 Stunden

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

in 4 Stunden

Nemotron-SFT-Math-v4 Mathematische Inferenz SFT-Datensatz

vor 10 Minuten

ChartNet-Diagramme Verstehen Multimodale Datensätze

vor 18 Tagen

EAVSD E-Commerce-Werbevideo-Storyboard-Datensatz

vor 18 Tagen

SMOL Multilingual Translation Parallel Dataset

vor 19 Tagen

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

vor 6 Tagen

ViMU-Datensatz Zum Verständnis Von Videometaphern

vor 19 Tagen

MemLens Multimodal Long Context Benchmark-Datensatz

vor 19 Tagen

MathNet Multimodaler Mathematischer Benchmark-Datensatz Für Inferenz

vor einem Monat

Claw-Eval Real-World Benchmark Dataset

vor einem Monat

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

vor einem Tag

PanScale Remote Sensing Pancolor Sharpening Dataset

vor 2 Monaten

ParseBench-Dokumentparsing-Fähigkeitsbewertungsdatensatz

vor 2 Monaten

BRIGHT-Datensatz Zur Bewertung Von Katastrophengebäuden

vor einem Tag

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

vor einem Tag

MDPBench Multilingual Document Parsing Benchmark Dataset

vor einem Tag

GPT-5.4-Schritt-für-Schritt-Schlussfolgerungsdatensatz

vor 2 Monaten

DRACO Cross-Domain Deep Research Benchmark-Datensatz

vor 2 Monaten

KI mit KI entwickeln

Von der Idee bis zum Launch – beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und bestem GPU-Preis.

KI-gestütztes kollaboratives Programmieren

Sofort einsatzbereite GPUs

Die besten Preise

Erste Schritte Preise anzeigen

HyperAI Newsletters

Abonnieren Sie unsere neuesten Updates

Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen

Unterstützt von MailChimp

Command Palette

HumanSense Benchmark-Datensatz

Zitat

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

HumanSense Benchmark-Datensatz

Zitat

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

Wörtliche Spannen Abfragebedingungs-Evidenz-Extraktionsdatensatz

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

Nemotron-SFT-Math-v4 Mathematische Inferenz SFT-Datensatz

ChartNet-Diagramme Verstehen Multimodale Datensätze

EAVSD E-Commerce-Werbevideo-Storyboard-Datensatz

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

ViMU-Datensatz Zum Verständnis Von Videometaphern

MemLens Multimodal Long Context Benchmark-Datensatz

MathNet Multimodaler Mathematischer Benchmark-Datensatz Für Inferenz

Claw-Eval Real-World Benchmark Dataset

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

PanScale Remote Sensing Pancolor Sharpening Dataset

ParseBench-Dokumentparsing-Fähigkeitsbewertungsdatensatz

BRIGHT-Datensatz Zur Bewertung Von Katastrophengebäuden

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

GPT-5.4-Schritt-für-Schritt-Schlussfolgerungsdatensatz

DRACO Cross-Domain Deep Research Benchmark-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Command Palette

HumanSense Benchmark-Datensatz

Zitat

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

Wörtliche Spannen Abfragebedingungs-Evidenz-Extraktionsdatensatz

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

Nemotron-SFT-Math-v4 Mathematische Inferenz SFT-Datensatz

ChartNet-Diagramme Verstehen Multimodale Datensätze

EAVSD E-Commerce-Werbevideo-Storyboard-Datensatz

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

ViMU-Datensatz Zum Verständnis Von Videometaphern

MemLens Multimodal Long Context Benchmark-Datensatz

MathNet Multimodaler Mathematischer Benchmark-Datensatz Für Inferenz

Claw-Eval Real-World Benchmark Dataset

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

PanScale Remote Sensing Pancolor Sharpening Dataset

ParseBench-Dokumentparsing-Fähigkeitsbewertungsdatensatz

BRIGHT-Datensatz Zur Bewertung Von Katastrophengebäuden

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

GPT-5.4-Schritt-für-Schritt-Schlussfolgerungsdatensatz

DRACO Cross-Domain Deep Research Benchmark-Datensatz

KI mit KI entwickeln

HyperAI Newsletters

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens

Wörtliche Spannen Abfragebedingungs-Evidenz-Extraktionsdatensatz

SAM 3D Artist Objects 3D-Objektrekonstruktionsdatensatz

Nemotron-SFT-Math-v4 Mathematische Inferenz SFT-Datensatz

ChartNet-Diagramme Verstehen Multimodale Datensätze

EAVSD E-Commerce-Werbevideo-Storyboard-Datensatz

SMOL Multilingual Translation Parallel Dataset

chi-bench Medical Intelligent Agent Benchmark Evaluation Dataset

ViMU-Datensatz Zum Verständnis Von Videometaphern

MemLens Multimodal Long Context Benchmark-Datensatz

MathNet Multimodaler Mathematischer Benchmark-Datensatz Für Inferenz

Claw-Eval Real-World Benchmark Dataset

RSRCC-Benchmark-Datensatz Zur Fernerkundung Von Flächenveränderungen

PanScale Remote Sensing Pancolor Sharpening Dataset

ParseBench-Dokumentparsing-Fähigkeitsbewertungsdatensatz

BRIGHT-Datensatz Zur Bewertung Von Katastrophengebäuden

OmniParsingBench Multimodal Parsing Capability Evaluation Dataset

MDPBench Multilingual Document Parsing Benchmark Dataset

GPT-5.4-Schritt-für-Schritt-Schlussfolgerungsdatensatz

DRACO Cross-Domain Deep Research Benchmark-Datensatz

Zugehörige Datensätze

MAKIEVAL Mehrsprachiger Datensatz Zur Bewertung Kulturellen Wissens