8ヶ月前

セマンティックセグメンテーション

コンピュータビジョン

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Brady Zhou Philipp Krähenbühl

概要

クロスビュー変換器を提案します。これは、複数のカメラからマップビューのセマンティックセグメンテーションを行うための効率的なアテンションベースモデルです。当社のアーキテクチャは、カメラ認識型クロスビュー注意メカニズムを使用して、個々のカメラビューから標準的なマップビュー表現へのマッピングを暗黙的に学習します。各カメラは、その内部パラメータと外部パラメータに依存する位置埋め込みを使用します。これらの位置埋め込みにより、変換器は幾何学的に明示的にモデリングすることなく、異なるビュー間でのマッピングを学習することができます。アーキテクチャは、各ビュー用の畳み込み画像エンコーダと、マップビューのセマンティックセグメンテーションを推論するためのクロスビュートランスフォーマーレイヤーで構成されています。当社のモデルは単純であり、容易に並列化でき、リアルタイムで動作します。提案されたアーキテクチャはnuScenesデータセットにおいて最先端の性能を達成しており、推論速度は4倍速くなっています。コードは以下のURLから入手可能です: https://github.com/bradyz/cross_view_transformers.

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

セマンティックセグメンテーション

コンピュータビジョン

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Brady Zhou Philipp Krähenbühl

概要

クロスビュー変換器を提案します。これは、複数のカメラからマップビューのセマンティックセグメンテーションを行うための効率的なアテンションベースモデルです。当社のアーキテクチャは、カメラ認識型クロスビュー注意メカニズムを使用して、個々のカメラビューから標準的なマップビュー表現へのマッピングを暗黙的に学習します。各カメラは、その内部パラメータと外部パラメータに依存する位置埋め込みを使用します。これらの位置埋め込みにより、変換器は幾何学的に明示的にモデリングすることなく、異なるビュー間でのマッピングを学習することができます。アーキテクチャは、各ビュー用の畳み込み画像エンコーダと、マップビューのセマンティックセグメンテーションを推論するためのクロスビュートランスフォーマーレイヤーで構成されています。当社のモデルは単純であり、容易に並列化でき、リアルタイムで動作します。提案されたアーキテクチャはnuScenesデータセットにおいて最先端の性能を達成しており、推論速度は4倍速くなっています。コードは以下のURLから入手可能です: https://github.com/bradyz/cross_view_transformers.

ソースPDF コードを表示

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています