HyperAIHyperAI

Command Palette

Search for a command to run...

OpenIns3D: 3Dオープンボキャブラリインスタンスセグメンテーションのスナップとルックアップ

Zhening Huang Xiaoyang Wu Xi Chen Hengshuang Zhao Lei Zhu Joan Lasenby

概要

本研究では、OpenIns3Dという新しい3D入力専用のフレームワークを紹介します。このOpenIns3Dフレームワークは、「Mask-Snap-Lookup」スキームを採用しています。「Mask」モジュールは、3D点群データからクラスに依存しないマスク提案を学習し、「Snap」モジュールは複数のスケールで合成されたシーンレベルの画像を生成し、2Dビジョン言語モデルを利用して興味深い物体を抽出します。「Lookup」モジュールは、「Snap」の結果から検索を行い、提案されたマスクにカテゴリ名を割り当てます。このアプローチは単純ながら、室内および室外データセットにおいて認識、物体検出、インスタンスセグメンテーションなどの広範な3Dオープンボキャブラリタスクで最先端の性能を達成しています。さらに、OpenIns3Dは異なる2D検出器間での容易な切り替えを可能にし、再学習を行う必要がありません。強力な2Dオープンワールドモデルと統合すると、シーン理解タスクにおいて優れた結果を得ることができます。また、大規模言語モデル(LLM)駆動の2Dモデルと組み合わせると、複雑な推論や現実世界の知識が必要となる高次元のテキストクエリを理解し処理する能力が著しく向上します。プロジェクトページ: https://zheninghuang.github.io/OpenIns3D/


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
OpenIns3D: 3Dオープンボキャブラリインスタンスセグメンテーションのスナップとルックアップ | 記事 | HyperAI超神経