HyperAIHyperAI

Command Palette

Search for a command to run...

文化施設における単段階アートワーク認識のための非教師ありドメイン適応スキーム

Giovanni Pasqualino Antonino Furnari Giovanni Signorello Giovanni Maria Farinella

概要

文化遺産におけるアート作品を、訪問者が撮影した視点(ファーストパーソンビジョン)からの画像を用いて認識することは、訪問者および施設管理者の両者にとって興味深い応用を可能にする。しかし、現在の完全教師あり設定で動作する物体検出アルゴリズムは、良好な性能を達成するためには大量のラベル付きデータを用いた学習が必要であり、そのデータ収集には多大な時間と高コストがかかる。文化遺産の3Dモデルから生成された合成データを用いてアルゴリズムを学習させることで、こうしたコストを削減できる。一方で、こうしたモデルを実際の画像でテストした場合、合成画像と実画像の間に存在する差異により、性能が著しく低下する問題が生じる。本研究では、文化遺産における物体検出のための「教師なしドメイン適応(Unsupervised Domain Adaptation)」という問題に着目した。この問題に対処するため、16種類の異なるアート作品を含む合成画像と実画像を備えた新しいデータセットを構築した。さらに、単段階検出器と二段階検出器、画像間変換(image-to-image translation)、特徴量の整合(feature alignment)に基づくさまざまなドメイン適応手法を検討した。本研究の観察結果として、単段階検出器が本研究で想定されるドメインシフトに対してより高いロバスト性を示すことが明らかになった。これを踏まえ、RetinaNetと特徴量整合を組み合わせた新しい手法「DA-RetinaNet」を提案した。提案手法は、提示したデータセットおよびCityscapesデータセットにおいて、比較対象となる手法よりも優れた性能を達成した。本分野の研究を支援するため、データセットは以下のリンクから公開している:https://iplab.dmi.unict.it/EGO-CH-OBJ-UDA/ また、提案アーキテクチャのコードは以下のGitHubリポジトリで公開している:https://github.com/fpv-iplab/DA-RetinaNet


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
文化施設における単段階アートワーク認識のための非教師ありドメイン適応スキーム | 記事 | HyperAI超神経