HyperAIHyperAI

Command Palette

Search for a command to run...

T2Net: 合成画像から実写画像への変換による単一画像深度推定タスクの解決

Chuanxia Zheng Tat-Jen Cham Jianfei Cai

概要

現在の単一画像深度推定手法は、実際の画像と深度のペアやステレオペアを用いた訓練データセットを使用していますが、これらのデータを取得することは容易ではありません。本研究では、合成画像と深度のペアおよび非対応の実際の画像を用いて訓練されたフレームワークを提案します。このフレームワークは、入力画像のリアリズムを向上させるための画像変換ネットワークと、その後に続く深度予測ネットワークから構成されています。重要なアイデアは、最初のネットワークが広範な入力変換器として機能し、合成画像または実際の画像を受け取り、理想的には最小限の修正で現実的な画像を生成することです。これは、訓練時の入力が実際の画像である場合には再構築損失を用い、合成画像である場合にはGAN損失を用いることで達成され、ヒューリスティックな自己正則化の必要性がなくなります。第二のネットワークは、合成画像と深度のペアに対するタスク損失で訓練され、さらにGAN損失が追加されて実際と合成の特徴分布を統一します。特に注目すべき点は、このフレームワークがエンドツーエンドで訓練できることであり、その結果として優れた性能が得られることで、初期の深層学習手法(リアルな対応データを使用)を超えることもあります。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています