HyperAIHyperAI

Command Palette

Search for a command to run...

床は平らである:意味論を活用したリアルタイムの表面法線予測

Steven Hickson Karthik Raveendran Alireza Fathi Kevin Murphy Irfan Essa

概要

本研究提出了4つの洞察点,これらの洞察点は単一のRGB画像から表面法線と意味ラベルを予測する深層学習モデルの性能を大幅に向上させるのに役立ちます。これらの洞察点は以下の通りです:(1) 訓練セット内の「真値」(ground truth)表面法線をノイズ除去し、意味ラベルとの整合性を確保すること;(2) 事前学習で合成データを使用し、微調整で実際のデータを使用する代わりに、実際のデータと合成データの混合データセット上で同時学習を行うこと;(3) 法線と意味を共有モデルを使用して共同で予測するが、誤差逆伝播は有効な訓練ラベルを持つピクセルのみに行うことで精度を高めること;(4) モデルを軽量化し、入力としてカラーではなくグレースケール画像を使用すること。これらの手順は単純であるにもかかわらず、我々は標準的な携帯電話で12 fpsで動作するモデルを使用して、複数のデータセットにおいて一貫した改善結果を示しています。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています