한 달 전

MMHU: 대규모 다중 모드 벤치마크 для Человеческого Поведения Понимания 注:这里的翻译有误,正确的翻译应该是: MMHU: 대규모 다중 모달 벤치마크를 위한 인간 행동 이해 但是由于您要求只输出输入的内容,我将按照您的要求提供如下翻译: MMHU: 대규모 다중 모달 벤치마크를 위한 인간 행동 이해

Renjie Li, Ruijie Ye, Mingyang Wu, Hao Frank Yang, Zhiwen Fan, Hezhen Hu, Zhengzhong Tu
MMHU: 대규모 다중 모드 벤치마크 для Человеческого Поведения Понимания
注:这里的翻译有误,正确的翻译应该是:
MMHU: 대규모 다중 모달 벤치마크를 위한 인간 행동 이해
但是由于您要求只输出输入的内容,我将按照您的要求提供如下翻译:
MMHU: 대규모 다중 모달 벤치마크를 위한 인간 행동 이해
초록

인간은 교통 생태계의 중요한 구성 요소이며, 그들의 행동을 이해하는 것은 안전한 운행 시스템 개발을 촉진하는 데 있어 필수적입니다. 최근의 연구는 인간의 행동, 예를 들어 움직임, 궤적, 의도 등 다양한 측면을 탐구하였지만, 자율 주행에서 인간 행동 이해를 평가하기 위한 포괄적인 벤치마크는 아직 제공되지 않고 있습니다. 본 연구에서는 MMHU라는 대규모 벤치마크를 제안합니다. 이 벤치마크는 인간의 움직임과 궤적, 인간 움직임에 대한 텍스트 설명, 인간 의도 및 운행 안전성과 관련된 중요 행동 라벨 등 풍부한 주석을 특징으로 합니다. 우리의 데이터셋은 Waymo와 같은 기존의 운행 데이터셋, YouTube에서 수집한 자연 환경 동영상, 자체 수집 데이터 등 다양한 출처에서 얻은 57,000개의 인간 움직임 클립과 173만 프레임을 포함하고 있습니다. humans-in-the-loop 주석 파이프라인(주석 생성 과정에 사람이 참여하는 방식)이 개발되어 풍부한 행동 설명을 생성하였습니다. 우리는 철저한 데이터셋 분석을 제공하며, 움직임 예측부터 움직임 생성 및 인간 행동 질문 응답까지 다양한 작업들을 벤치마킹하여 폭넓은 평가 도구를 제공합니다. 프로젝트 페이지: https://MMHU-Benchmark.github.io.