2ヶ月前

水中画像の高速強化による視覚認識の向上

Md Jahidul Islam; Youya Xia; Junaed Sattar
水中画像の高速強化による視覚認識の向上
要約

本論文では、リアルタイムの水中画像強化に向けた条件付きジェネレーティブ・アドバーザリアル・ネットワーク(CGAN)ベースのモデルを提案します。敵対的訓練を監督するために、全体的なコンテンツ、色、局所的なテクスチャ、およびスタイル情報を基にした知覚的画像品質を評価する目的関数を定式化しました。また、EUVPという大規模データセットを紹介します。このデータセットは、海洋探査や人間とロボットの協調実験中に7種類の異なるカメラを使用して撮影された「低品質」と「高品質」の水中画像のペアと非ペアの集合体から構成されています。さらに、いくつかの定性的および定量的評価を行い、提案されたモデルがペアおよび非ペア訓練から水中画像品質を強化することを学習できることが示されました。特に重要なのは、強化された画像が水中物体検出、人間姿勢推定、注目度予測などの標準モデルの性能向上に寄与することです。これらの結果は、視覚ガイド型水中ロボットによる自律パイプラインでのリアルタイム前処理として適していることを証明しています。本モデルおよび関連する訓練パイプラインは、https://github.com/xahidbuffon/funie-gan で公開されています。科技/学术术语处理:条件付きジェネレーティブ・アドバーザリアル・ネットワーク(CGAN):Conditional Generative Adversarial Network敵対的訓練:Adversarial Training目的関数:Objective Function知覚的画像品質:Perceptual Image Quality局所的なテクスチャ:Local Textureデータセット:Dataset海洋探査:Oceanic Exploration人間とロボットの協調実験:Human-Robot Collaborative Experiments強化:Enhancement物体検出:Object Detection姿勢推定:Pose Estimation注目度予測:Saliency Prediction視覚ガイド型水中ロボット:Visually-Guided Underwater Robots自律パイプライン:Autonomy Pipeline

水中画像の高速強化による視覚認識の向上 | 最新論文 | HyperAI超神経