8ヶ月前

コンピュータビジョン

コンピュータビジョン

Chen Shuo ; Yu Tan ; Li Ping

概要

最近、マルチレイヤーパーセプトロン（MLP）のみを使用したビジョンアーキテクチャが、コンピュータビジョンの研究コミュニティで大きな注目を集めています。MLPのようなモデルは、手作りの畳み込み層を用いず、少ない帰納的バイアスで単一の2D画像分類において競争力のある性能を達成しています。本研究では、視点ベースの3Dオブジェクト認識タスクにおけるMLPベースのアーキテクチャの有効性を探求します。私たちは、Round-Roll MLP（R $^2$ -MLP）と呼ばれるMLPベースのアーキテクチャを提案します。このアーキテクチャは、異なる視点間でのパッチ間通信を考慮することにより、空間シフトMLPバックボーンを拡張しています。R $^2$ -MLPは、視点次元に沿ってチャンネルの一部をロールし、隣接する視点間での情報交換を促進します。私たちはModelNet10およびModelNet40データセット上で様々な観点からの検証を行った結果をベンチマークとして示します。実験結果は、概念的にシンプルな構造を持つ私たちのR $^2$ -MLPが既存の最先端手法と比較して競争力のある性能を達成していることを示しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

8ヶ月前

コンピュータビジョン

コンピュータビジョン

Chen Shuo ; Yu Tan ; Li Ping

概要

最近、マルチレイヤーパーセプトロン（MLP）のみを使用したビジョンアーキテクチャが、コンピュータビジョンの研究コミュニティで大きな注目を集めています。MLPのようなモデルは、手作りの畳み込み層を用いず、少ない帰納的バイアスで単一の2D画像分類において競争力のある性能を達成しています。本研究では、視点ベースの3Dオブジェクト認識タスクにおけるMLPベースのアーキテクチャの有効性を探求します。私たちは、Round-Roll MLP（R $^2$ -MLP）と呼ばれるMLPベースのアーキテクチャを提案します。このアーキテクチャは、異なる視点間でのパッチ間通信を考慮することにより、空間シフトMLPバックボーンを拡張しています。R $^2$ -MLPは、視点次元に沿ってチャンネルの一部をロールし、隣接する視点間での情報交換を促進します。私たちはModelNet10およびModelNet40データセット上で様々な観点からの検証を行った結果をベンチマークとして示します。実験結果は、概念的にシンプルな構造を持つ私たちのR $^2$ -MLPが既存の最先端手法と比較して競争力のある性能を達成していることを示しています。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

R2-MLP: 多視点3D物体認識用のRound-Roll MLP | 記事 | HyperAI超神経