HyperAIHyperAI
il y a 2 mois

Un réseau de type Inception dilaté pour la prédiction de la salience visuelle

Sheng Yang; Guosheng Lin; Qiuping Jiang; Weisi Lin
Un réseau de type Inception dilaté pour la prédiction de la salience visuelle
Résumé

Récemment, avec l'arrivée des réseaux de neurones convolutifs profonds (DCNN), les progrès réalisés dans la recherche sur la prédiction de la saillance visuelle sont impressionnants. Une direction possible pour la prochaine amélioration serait de caractériser pleinement les facteurs influençant la saillance à différentes échelles avec un module computationnellement efficace dans les architectures DCNN. Dans ce travail, nous avons proposé un réseau d'inception dilaté (DINet) de bout en bout pour la prédiction de la saillance visuelle. Ce réseau capture efficacement les caractéristiques contextuelles à différentes échelles avec très peu de paramètres supplémentaires. Au lieu d'utiliser des convolutions standards parallèles avec des tailles de noyaux différentes comme le font les modules d'inception existants, notre module d'inception dilaté (DIM) utilise des convolutions dilatées parallèles avec différents taux de dilatation, ce qui peut réduire considérablement la charge de calcul tout en enrichissant la diversité des champs récepteurs dans les cartes de caractéristiques. De plus, les performances de notre modèle de saillance sont encore améliorées en utilisant une série de métriques de distance basées sur une normalisation linéaire comme fonctions de perte. Ainsi, nous pouvons formuler la prédiction de la saillance comme une tâche de prédiction d'une distribution de probabilité pour l'inférence globale de la saillance au lieu d'un problème typique de régression pixel par pixel. Les résultats expérimentaux sur plusieurs jeux de données基准数据集 démonstrent que notre DINet avec les fonctions de perte proposées peut atteindre des performances d'état de l'art avec un temps d'inférence plus court.注:在“jeux de données基准数据集”中,“基准数据集”是中文,不是原文的一部分。正确的翻译应该是:Les résultats expérimentaux sur plusieurs jeux de données difficiles démontrent que notre DINet avec les fonctions de perte proposées peut atteindre des performances d'état de l'art avec un temps d'inférence plus court.