8ヶ月前

オブジェクト追跡

オブジェクト検出

3D マシンビジョン

コンピュータビジョン

Yizhou Wang Tim Meinhardt Orcun Cetintas Cheng-Yen Yang Sameer S. Pusegaonkar Benjamin Missaoui Sujit Biswas Zheng Tang Laura Leal-Taixé

概要

多視点カメラからの物体認識は、倉庫、小売店、病院などの屋内環境における知能システムにとって重要な役割を果たしています。従来の多目標多視点カメラ（MTMC）検出および追跡手法は、2D物体検出、単一視点多物体追跡（MOT）、および視点間再識別（ReID）技術に依存しており、多視点画像の集約による重要な3D情報を適切に処理していません。本論文では、鳥瞰図（BEV）で3D物体検出を行うための多視点画像と必要最低限のカメラキャリブレーションパラメータを集約する3D物体検出および追跡フレームワークであるMCBLTを提案します。次に、階層的なグラフニューラルネットワーク（GNNs）を導入し、BEVでのこれらの3D検出結果を追跡することでMTMC追跡結果を得ます。既存の手法とは異なり、MCBLTは異なるシーンや様々なカメラ設定に対して優れた汎化能力を持ち、長期的な関連付け処理にも卓越した能力があります。その結果、提案したMCBLTはAICity'24データセットで81.22 HOTA、WildTrackデータセットで95.6 IDF1という新しい最先端の性能を達成しました。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

オブジェクト追跡

オブジェクト検出

3D マシンビジョン

コンピュータビジョン

Yizhou Wang Tim Meinhardt Orcun Cetintas Cheng-Yen Yang Sameer S. Pusegaonkar Benjamin Missaoui Sujit Biswas Zheng Tang Laura Leal-Taixé

概要

多視点カメラからの物体認識は、倉庫、小売店、病院などの屋内環境における知能システムにとって重要な役割を果たしています。従来の多目標多視点カメラ（MTMC）検出および追跡手法は、2D物体検出、単一視点多物体追跡（MOT）、および視点間再識別（ReID）技術に依存しており、多視点画像の集約による重要な3D情報を適切に処理していません。本論文では、鳥瞰図（BEV）で3D物体検出を行うための多視点画像と必要最低限のカメラキャリブレーションパラメータを集約する3D物体検出および追跡フレームワークであるMCBLTを提案します。次に、階層的なグラフニューラルネットワーク（GNNs）を導入し、BEVでのこれらの3D検出結果を追跡することでMTMC追跡結果を得ます。既存の手法とは異なり、MCBLTは異なるシーンや様々なカメラ設定に対して優れた汎化能力を持ち、長期的な関連付け処理にも卓越した能力があります。その結果、提案したMCBLTはAICity'24データセットで81.22 HOTA、WildTrackデータセットで95.6 IDF1という新しい最先端の性能を達成しました。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています