HyperAIHyperAI

Command Palette

Search for a command to run...

휴먼센스 벤치마크(HumanSense Benchmark)는 시안 교통대학교가 앤트 그룹(Ant Group)과 공동으로 2025년에 발표한 인간 지각 평가 벤치마크 데이터셋입니다. 관련 연구 논문의 제목은 "HumanSense: 추론 MLLM을 통한 다중 모드 인식에서 공감적 상황 인식 반응으로목표는 시각, 오디오, 텍스트와 같은 다중 모드 정보를 융합하여 모델의 실제 상호작용 능력을 종합적으로 측정하는 것입니다. 이 데이터세트는 3,291개의 비디오 기반 질문과 591개의 오디오 기반 질문을 포함하고 있으며, 난이도가 점차 높아지는 15개 과제를 다룹니다. 과제 구조는 다음을 포함하는 4단계 피라미드 구조입니다.

  • L1–L2 지각 계층: 시각, 청각 및 교차 모달 지각을 위한 기본적이고 복잡한 지각 능력
  • L3 이해 계층: 상호 작용 상황에 기반한 암묵적 관계, 감정 및 상태를 이해하는 능력
  • L4 대응 계층: 대화형 시나리오에서의 전략적이고 상황에 맞는 대응 역량. 이 데이터셋은 실제 비디오, 오디오, 그리고 다중 모드 대화에서 질문을 구성합니다. 다양한 오픈소스 데이터셋과 실제 현장 녹화 자료를 통해 생성되었으며, 외모 인식, 감정 인식, 관계 이해, 심리적 대화 등 다양한 인간 중심 상호작용 과제를 포괄합니다. 실제 인간 의사소통 시나리오에 더욱 가까운 현존하는 다중 모드 평가 벤치마크 중 하나입니다.
    데이터셋 분포
    데이터셋 분포

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp