6ヶ月前

コンピュータビジョン

ディープラーニング

コンピュータビジョン

Mohammed Suhail Abhay Mittal Behjat Siddiquie Chris Broaddus Jayan Eledath Gerard Medioni Leonid Sigal

概要

従来のシーングラフ生成手法は、物体と関係性を独立したエンティティとして扱う交差エントロピー損失関数を用いて学習される。しかし、このような定式化は、出力空間における構造を無視しており、本質的に構造化された予測問題においては不適切である。本研究では、シーングラフの生成を目的とした新たなエネルギーに基づく学習フレームワークを提案する。提案する定式化は、出力空間におけるシーングラフの構造を効率的に組み込むことが可能となる。この学習フレームワークにおける追加的な制約は、誘導バイアス（inductive bias）として機能し、少量のラベルからモデルが効率的に学習できるようにする。本研究で提案するエネルギーに基づくフレームワークを用いて、既存の最先端モデルを再学習した結果、Visual GenomeおよびGQAのベンチマークデータセットにおいて、それぞれ最大21%および27%の性能向上が達成された。さらに、データが限られたゼロショットおよび少数ショット設定においても、本フレームワークの学習効率の優位性を実証し、優れた性能を示した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

6ヶ月前

コンピュータビジョン

ディープラーニング

コンピュータビジョン

Mohammed Suhail Abhay Mittal Behjat Siddiquie Chris Broaddus Jayan Eledath Gerard Medioni Leonid Sigal

概要

従来のシーングラフ生成手法は、物体と関係性を独立したエンティティとして扱う交差エントロピー損失関数を用いて学習される。しかし、このような定式化は、出力空間における構造を無視しており、本質的に構造化された予測問題においては不適切である。本研究では、シーングラフの生成を目的とした新たなエネルギーに基づく学習フレームワークを提案する。提案する定式化は、出力空間におけるシーングラフの構造を効率的に組み込むことが可能となる。この学習フレームワークにおける追加的な制約は、誘導バイアス（inductive bias）として機能し、少量のラベルからモデルが効率的に学習できるようにする。本研究で提案するエネルギーに基づくフレームワークを用いて、既存の最先端モデルを再学習した結果、Visual GenomeおよびGQAのベンチマークデータセットにおいて、それぞれ最大21%および27%の性能向上が達成された。さらに、データが限られたゼロショットおよび少数ショット設定においても、本フレームワークの学習効率の優位性を実証し、優れた性能を示した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています