HyperAIHyperAI

Command Palette

Search for a command to run...

iLRM:反復型大規模3D再構成モデル

Gyeongjin Kang Seungtae Nam Xiangyu Sun Sameh Khamis Abdelrahman Mohamed Eunbyung Park

概要

フィードフォワード型3次元モデリングは、高速かつ高品質な3次元再構成を実現する有望なアプローチとして注目を集めている。特に、3Dガウススプラッティングのような明示的な3次元表現を直接生成する手法は、高速かつ高品質なレンダリング性能と多岐にわたる応用可能性から、大きな注目を集めている。しかし、多くの最先端手法はトランスフォーマー構造に基づいているため、複数の入力ビューから得られる画像トークン間の完全なアテンションに依存しており、ビュー数や画像解像度が増加するにつれて計算コストが飛躍的に増大するという深刻なスケーラビリティの問題を抱えている。こうした課題を克服し、スケーラブルかつ効率的なフィードフォワード型3次元再構成を実現するために、本研究では、3Dガウス表現を反復的精緻化機構を用いて生成する、反復型大規模3次元再構成モデル(iLRM)を提案する。本モデルは以下の3つの核心原則に基づいて設計されている:(1)シーン表現を入力ビューの画像から分離することで、コンパクトな3次元表現を実現する;(2)完全アテンション型のマルチビュー相互作用を二段階アテンションスキームに分解し、計算コストを低減する;(3)各層において高解像度情報を注入することで、高忠実度な再構成を達成する。RE10KやDL3DVなど広く用いられるデータセットにおける実験結果から、iLRMは既存手法と比較して再構成品質と処理速度の両面で優れた性能を示した。特に、iLRMは優れたスケーラビリティを備えており、同等の計算コスト下でより多くの入力ビューを効率的に活用することで、顕著に高い再構成品質を実現している。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています