7ヶ月前

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Hongje Seong Junhyuk Hyun Euntai Kim

概要

シーン認識は、画像が撮影された場所のカテゴリーを予測することを目指す画像認識の問題である。本論文では、畳み込みニューラルネットワーク（CNN）を使用した新しいシーン認識手法を提案する。提案手法は、与えられた画像内の物体情報とシーン情報の融合に基づいており、CNNフレームワークはFOS（fusion of object and scene）Netと名付けられている。さらに、FOSNetの学習とシーン認識性能の向上のために、新しい損失関数であるシーン一貫性損失（SCL: scene coherence loss）を開発した。提案されたSCLは、「シーネネス」（sceneness）が広がり、画像全体でシーンクラスが変化しないというシーンの独自の特性に基づいている。提案されたFOSNetは、最も人気のある3つのシーン認識データセットで実験され、2つのデータセットにおいて最先端の性能を達成した：Places 2では60.14%、MIT室内67では90.37%である。また、SUN 397においては第2位の性能である77.28%を達成した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

7ヶ月前

畳み込みニューラルネットワーク

アプローチ／フレームワーク

コンピュータビジョン

Hongje Seong Junhyuk Hyun Euntai Kim

概要

シーン認識は、画像が撮影された場所のカテゴリーを予測することを目指す画像認識の問題である。本論文では、畳み込みニューラルネットワーク（CNN）を使用した新しいシーン認識手法を提案する。提案手法は、与えられた画像内の物体情報とシーン情報の融合に基づいており、CNNフレームワークはFOS（fusion of object and scene）Netと名付けられている。さらに、FOSNetの学習とシーン認識性能の向上のために、新しい損失関数であるシーン一貫性損失（SCL: scene coherence loss）を開発した。提案されたSCLは、「シーネネス」（sceneness）が広がり、画像全体でシーンクラスが変化しないというシーンの独自の特性に基づいている。提案されたFOSNetは、最も人気のある3つのシーン認識データセットで実験され、2つのデータセットにおいて最先端の性能を達成した：Places 2では60.14%、MIT室内67では90.37%である。また、SUN 397においては第2位の性能である77.28%を達成した。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

FOSNet: シーン認識のためのエンドツーエンドで学習可能な深層ニューラルネットワーク | 記事 | HyperAI超神経