Command Palette
Search for a command to run...
{Junwei Han Nian Liu}

要約
従来の顕著対象検出モデルは、しばしば手作業で設計された特徴量を用いて対比度やさまざまな事前知識を定式化し、それらを人工的に組み合わせていた。本研究では、畳み込みニューラルネットワーク(CNN)に基づく、エンドツーエンドで学習可能な階層的顕著性ネットワーク(DHSNet)を提案する。DHSNetは、まずグローバルな構造的顕著性の手がかり(グローバルな対比度、オブジェクト性、コンパクト性など)を自動的に学習し、それらの最適な組み合わせを含む粗いグローバルな予測を行う。その後、局所的な文脈情報を統合することで、段階的に詳細を階層的にかつ順次に精緻化するため、新規の階層的再帰型畳み込みニューラルネットワーク(HRCNN)を採用する。全体のアーキテクチャは、グローバルからローカル、粗いものから細かいものへと処理を進める方式を採用している。DHSNetは、入力画像と対応する真値の顕著性マスクを用いて直接学習される。テスト時には、他の技術に依存せずに、テスト画像をネットワークに直接前向きに入力するだけで、効率的に顕著性マップを生成できる。4つのベンチマークデータセットにおける評価および他の11の最先端アルゴリズムとの比較から、DHSNetは性能面で顕著な優位性を示すとともに、現代のGPU上で実時間(23 FPS)での処理を達成していることが明らかになった。
ベンチマーク
| ベンチマーク | 方法論 | 指標 |
|---|---|---|
| salient-object-detection-on-duts-te | DHS | MAE: 0.065 max F-measure: 0.815 |