8ヶ月前

オブジェクト検出

ディープラーニング

コンピュータビジョン

コンピュータビジョン

Jeet Vora Swetanjal Dutta Kanishk Jain Shyamgopal Karthik Vineet Gandhi

概要

マルチビュー検出（MVD）は、混雑した環境における遮蔽推論に非常に効果的です。近年、深層学習を用いた研究では著しい進展が見られましたが、一般化の側面が見落とされており、これが実世界での適用を困難にしていました。当研究の主要な新規性は、3つの重要な一般化形式を形式化し、それらを評価するための実験を提案することにあります。具体的には、i) カメラ数の変動、ii) カメラ位置の変動、そして最後に iii) 新たなシーンへの一般化について評価します。既存の最先端モデルは単一のシーンとカメラ設定に過学習しているため、一般的な一般化性能が低くあることが判明しました。これらの問題に対処するために：(a) 様々なシーンや時間帯、カメラ設定、カメラ数の変動を取り入れた新しい汎用MVDデータセット（GMVD）を提案し、(b) MVDにおける一般化に必要な特性について議論し、それらを取り入れるための基本的なモデルを提案しています。WildTrack, MultiViewX, およびGMVDデータセットを使用して包括的な実験を行い、MVD手法の一般化能力を評価する必要性と提案手法の有効性を示しています。コードと提案データセットは https://github.com/jeetv/GMVD で公開されています。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

オブジェクト検出

ディープラーニング

コンピュータビジョン

コンピュータビジョン

Jeet Vora Swetanjal Dutta Kanishk Jain Shyamgopal Karthik Vineet Gandhi

概要

マルチビュー検出（MVD）は、混雑した環境における遮蔽推論に非常に効果的です。近年、深層学習を用いた研究では著しい進展が見られましたが、一般化の側面が見落とされており、これが実世界での適用を困難にしていました。当研究の主要な新規性は、3つの重要な一般化形式を形式化し、それらを評価するための実験を提案することにあります。具体的には、i) カメラ数の変動、ii) カメラ位置の変動、そして最後に iii) 新たなシーンへの一般化について評価します。既存の最先端モデルは単一のシーンとカメラ設定に過学習しているため、一般的な一般化性能が低くあることが判明しました。これらの問題に対処するために：(a) 様々なシーンや時間帯、カメラ設定、カメラ数の変動を取り入れた新しい汎用MVDデータセット（GMVD）を提案し、(b) MVDにおける一般化に必要な特性について議論し、それらを取り入れるための基本的なモデルを提案しています。WildTrack, MultiViewX, およびGMVDデータセットを使用して包括的な実験を行い、MVD手法の一般化能力を評価する必要性と提案手法の有効性を示しています。コードと提案データセットは https://github.com/jeetv/GMVD で公開されています。

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

深層多視点歩行者検出の一般化を目指して | 記事 | HyperAI超神経