HyperAIHyperAI

Command Palette

Search for a command to run...

最終層を越えて:エージェント補間初期化を用いた階層的クエリ統合Transformerによる3Dインスタンスセグメンテーション

Jiahao Lu Jiacheng Deng Tianzhu Zhang

概要

3Dインスタンスセグメンテーションは、シーン内のオブジェクトインスタンスの集合を予測し、対応する意味ラベルを持つバイナリフォアグラウンドマスクとして表現することを目的としている。現在、幾何学的特性の手動選定を低減し、洗練されたパイプラインと優れた性能を実現する点から、Transformerベースの手法が注目を集めている。しかし、Transformerベースの手法は、クエリ初期化段階で位置情報とコンテンツ情報の両方を同時に強固に保持できないという課題を抱えている。さらに、各デコーダ層で監視が行われるため、層の深さが増すにつれてオブジェクトの消失現象が生じる問題も存在する。これらの課題を克服するため、本研究では「最終層を超えて:エージェント補間初期化を用いた階層的クエリ統合Transformer(BFL)」を提案する。具体的には、フォアグラウンドカバレッジとコンテンツ学習のバランスを実現可能な耐障害性の高いクエリを生成するための「エージェント補間初期化モジュール」を設計した。また、層の深さに伴うリコール低下を緩和するため、低重複クエリを保持する「階層的クエリ統合デコーダ」を提案している。ScanNetV2、ScanNet200、ScanNet++、S3DISの4つのデータセットにおける広範な実験により、BFLが優れた性能を発揮することが実証された。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
最終層を越えて:エージェント補間初期化を用いた階層的クエリ統合Transformerによる3Dインスタンスセグメンテーション | 記事 | HyperAI超神経