HyperAIHyperAI

Command Palette

Search for a command to run...

CAFuser: 運転シーンの堅牢な意味認識のための状態認識マルチモーダル融合

Tim Brödermann Christos Sakaridis Yuqian Fu Luc Van Gool

概要

自律走行における堅牢な意味認識のためには、複数のセンサを活用することが重要です。各センサタイプは補完的な強みと弱点を持つためです。しかし、既存のセンサ融合手法は多くの場合、すべての条件下でセンサを均一に扱う傾向があり、これが最適でない性能を引き起こしています。これに対して、我々は堅牢なドライビングシーンの意味認識のために新しい状況認識型多モーダル融合アプローチを提案します。当該手法CAFuser(Condition-Aware Fusion user)では、RGBカメラ入力を用いて環境条件を分類し、その結果に基づく「状況トークン」を生成して、複数のセンサモーダルの融合をガイドします。さらに、当研究では各モーダル固有の特徴量アダプタを新たに導入し、異なるセンサ入力を共有潜在空間に合わせることで、単一かつ共有された事前学習済みバックボーンとの効率的な統合を可能にしました。実際の状況に基づいて動的にセンサ融合を行うことで、特に悪条件下でのシナリオにおいて堅牢性と精度が大幅に向上します。CAFuserは公開されているMUSESベンチマークで首位となり、マルチモーダルパノプティック品質指標(PQ)で59.7%、意味分割平均交差率(mIoU)で78.2%という成績を達成しました。またDeLiVERでも新たな最先端技術として位置づけられています。ソースコードは以下のURLから公開されています: https://github.com/timbroed/CAFuser.


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
CAFuser: 運転シーンの堅牢な意味認識のための状態認識マルチモーダル融合 | 記事 | HyperAI超神経