@article{qin2025humansense, title={HumanSense: From Multimodal Perception to Empathetic Context-Aware Responses through Reasoning MLLMs}, author={Qin, Zheng and Zheng, Ruobing and Wang, Yabing and Li, Tianqi and Yuan, Yi and Chen, Jingdong and Wang, Le}, journal={arXiv preprint arXiv:2508.10576}, year={2025} }

날짜

8달 전

조직

태그

휴먼센스 벤치마크(HumanSense Benchmark)는 시안 교통대학교가 앤트 그룹(Ant Group)과 공동으로 2025년에 발표한 인간 지각 평가 벤치마크 데이터셋입니다. 관련 연구 논문의 제목은 "HumanSense: 추론 MLLM을 통한 다중 모드 인식에서 공감적 상황 인식 반응으로목표는 시각, 오디오, 텍스트와 같은 다중 모드 정보를 융합하여 모델의 실제 상호작용 능력을 종합적으로 측정하는 것입니다. 이 데이터세트는 3,291개의 비디오 기반 질문과 591개의 오디오 기반 질문을 포함하고 있으며, 난이도가 점차 높아지는 15개 과제를 다룹니다. 과제 구조는 다음을 포함하는 4단계 피라미드 구조입니다.

L1–L2 지각 계층: 시각, 청각 및 교차 모달 지각을 위한 기본적이고 복잡한 지각 능력
L3 이해 계층: 상호 작용 상황에 기반한 암묵적 관계, 감정 및 상태를 이해하는 능력
L4 대응 계층: 대화형 시나리오에서의 전략적이고 상황에 맞는 대응 역량. 이 데이터셋은 실제 비디오, 오디오, 그리고 다중 모드 대화에서 질문을 구성합니다. 다양한 오픈소스 데이터셋과 실제 현장 녹화 자료를 통해 생성되었으며, 외모 인식, 감정 인식, 관계 이해, 심리적 대화 등 다양한 인간 중심 상호작용 과제를 포괄합니다. 실제 인간 의사소통 시나리오에 더욱 가까운 현존하는 다중 모드 평가 벤치마크 중 하나입니다.
데이터셋 분포

소환

@article{qin2025humansense,
title={HumanSense: From Multimodal Perception to Empathetic Context-Aware Responses through Reasoning MLLMs},
author={Qin, Zheng and Zheng, Ruobing and Wang, Yabing and Li, Tianqi and Yuan, Yi and Chen, Jingdong and Wang, Le},
journal={arXiv preprint arXiv:2508.10576},
year={2025}
}

이 데이터셋은 커뮤니티 사용자가 기여한 것이며 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

undefined

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

HyperAI

이 데이터셋 사용 Discord에서 논의하기

날짜

8달 전

조직

태그

L1–L2 지각 계층: 시각, 청각 및 교차 모달 지각을 위한 기본적이고 복잡한 지각 능력
L3 이해 계층: 상호 작용 상황에 기반한 암묵적 관계, 감정 및 상태를 이해하는 능력
L4 대응 계층: 대화형 시나리오에서의 전략적이고 상황에 맞는 대응 역량. 이 데이터셋은 실제 비디오, 오디오, 그리고 다중 모드 대화에서 질문을 구성합니다. 다양한 오픈소스 데이터셋과 실제 현장 녹화 자료를 통해 생성되었으며, 외모 인식, 감정 인식, 관계 이해, 심리적 대화 등 다양한 인간 중심 상호작용 과제를 포괄합니다. 실제 인간 의사소통 시나리오에 더욱 가까운 현존하는 다중 모드 평가 벤치마크 중 하나입니다.
데이터셋 분포

소환

@article{qin2025humansense,
title={HumanSense: From Multimodal Perception to Empathetic Context-Aware Responses through Reasoning MLLMs},
author={Qin, Zheng and Zheng, Ruobing and Wang, Yabing and Li, Tianqi and Yuan, Yi and Chen, Jingdong and Wang, Le},
journal={arXiv preprint arXiv:2508.10576},
year={2025}
}

3달 전

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Command Palette

HumanSense 벤치마크 데이터 세트

소환

AI로 AI 구축

HyperAI Newsletters

Command Palette

HumanSense 벤치마크 데이터 세트

소환

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

Verbatim Spans 쿼리 조건 증거 추출 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

Nemotron-SFT-Math-v4 수학적 추론 SFT 데이터셋

ChartNet 차트를 이용한 다중 모달 데이터셋 이해

EAVSD 전자상거래 광고 비디오 스토리보드 데이터셋

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

PanScale 원격 감지 팬컬러 선명도 향상 데이터 세트

ParseBench 문서 구문 분석 기능 평가 데이터 세트

BRIGHT 재난 건물 평가 데이터 세트

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

GPT-5.4 단계별 추론 데이터셋

DRACO 학제간 심층 연구 벤치마크 데이터셋

AI로 AI 구축

HyperAI Newsletters

Command Palette

HumanSense 벤치마크 데이터 세트

소환

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

Verbatim Spans 쿼리 조건 증거 추출 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

Nemotron-SFT-Math-v4 수학적 추론 SFT 데이터셋

ChartNet 차트를 이용한 다중 모달 데이터셋 이해

EAVSD 전자상거래 광고 비디오 스토리보드 데이터셋

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

PanScale 원격 감지 팬컬러 선명도 향상 데이터 세트

ParseBench 문서 구문 분석 기능 평가 데이터 세트

BRIGHT 재난 건물 평가 데이터 세트

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

GPT-5.4 단계별 추론 데이터셋

DRACO 학제간 심층 연구 벤치마크 데이터셋

AI로 AI 구축

HyperAI Newsletters

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트

Verbatim Spans 쿼리 조건 증거 추출 데이터 세트

SAM 3D 아티스트 객체 3D 객체 재구성 데이터 세트

Nemotron-SFT-Math-v4 수학적 추론 SFT 데이터셋

ChartNet 차트를 이용한 다중 모달 데이터셋 이해

EAVSD 전자상거래 광고 비디오 스토리보드 데이터셋

SMOL 다국어 번역 병렬 데이터 세트

chi-bench 의료 지능형 에이전트 벤치마크 평가 데이터 세트

ViMU 비디오 은유 이해 데이터셋

MemLens 멀티모달 장기 컨텍스트 벤치마크 데이터셋

MathNet 멀티모달 수학 벤치마크 추론 데이터셋

Claw-Eval 실세계 벤치마크 데이터셋

RSRCC 원격 감지 영역 변화 이해 벤치마크 데이터 세트

PanScale 원격 감지 팬컬러 선명도 향상 데이터 세트

ParseBench 문서 구문 분석 기능 평가 데이터 세트

BRIGHT 재난 건물 평가 데이터 세트

OmniParsingBench 멀티모달 구문 분석 기능 평가 데이터 세트

MDPBench 다국어 문서 구문 분석 벤치마크 데이터셋

GPT-5.4 단계별 추론 데이터셋

DRACO 학제간 심층 연구 벤치마크 데이터셋

undefined

MAKIEVAL 다국어 문화 지식 평가 데이터 세트