7ヶ月前

マルチモーダル

視覚質問応答

マルチタスク学習

アプローチ／フレームワーク

マルチモーダル

Renjie Li Ruijie Ye Mingyang Wu Hao Frank Yang Zhiwen Fan Hezhen Hu Zhengzhong Tu

概要

人間は輸送生態系の重要な構成要素であり、その行動を理解することは安全な運転システムの開発を促進するために不可欠です。最近の研究では、人間の行動に関する様々な側面（運動、軌跡、意図など）が探られていますが、自動運転における人間の行動理解を評価するための包括的なベンチマークはまだ存在していません。本研究では、MMHUと呼ばれる大規模なベンチマークを提案します。このベンチマークには豊富な注釈が含まれており、人間の運動や軌跡、人間の運動に関するテキスト記述、人間の意図、および運転安全に関連する重要行動ラベルなどが特徴として挙げられます。当データセットは多様なソースから収集された57,000件の人間運動クリップと173万フレームで構成されており、Waymoなどの確立された運転データセット、YouTubeからの野生環境映像、自ら収集したデータなどを含んでいます。ヒューマンインザループ方式による注釈パイプラインを開発し、豊富な行動キャプションを生成しています。私たちはデータセット分析を行い、動作予測から動作生成まで人間の行動に関する質問応答まで複数のタスクをベンチマーク化することで、広範な評価スイートを提供しています。プロジェクトページ: https://MMHU-Benchmark.github.io.

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

マルチモーダル

視覚質問応答

マルチタスク学習

アプローチ／フレームワーク

マルチモーダル

Renjie Li Ruijie Ye Mingyang Wu Hao Frank Yang Zhiwen Fan Hezhen Hu Zhengzhong Tu

概要

人間は輸送生態系の重要な構成要素であり、その行動を理解することは安全な運転システムの開発を促進するために不可欠です。最近の研究では、人間の行動に関する様々な側面（運動、軌跡、意図など）が探られていますが、自動運転における人間の行動理解を評価するための包括的なベンチマークはまだ存在していません。本研究では、MMHUと呼ばれる大規模なベンチマークを提案します。このベンチマークには豊富な注釈が含まれており、人間の運動や軌跡、人間の運動に関するテキスト記述、人間の意図、および運転安全に関連する重要行動ラベルなどが特徴として挙げられます。当データセットは多様なソースから収集された57,000件の人間運動クリップと173万フレームで構成されており、Waymoなどの確立された運転データセット、YouTubeからの野生環境映像、自ら収集したデータなどを含んでいます。ヒューマンインザループ方式による注釈パイプラインを開発し、豊富な行動キャプションを生成しています。私たちはデータセット分析を行い、動作予測から動作生成まで人間の行動に関する質問応答まで複数のタスクをベンチマーク化することで、広範な評価スイートを提供しています。プロジェクトページ: https://MMHU-Benchmark.github.io.

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

MMHU: 大規模マルチモーダル人間行動理解ベンチマーク | 記事 | HyperAI超神経