il y a 8 mois

Résumé

TASED-Net est une architecture de réseau neuronal entièrement convolutif en trois dimensions (3D) destinée à la détection de la salience dans les vidéos. Elle se compose de deux éléments principaux : d'abord, le réseau encodeur extrait des caractéristiques spatio-temporelles à faible résolution à partir d'une séquence d'images consécutives, puis le réseau de prédiction suivant décode ces caractéristiques spatialement tout en agrégant toutes les informations temporelles. En conséquence, une seule carte de prédiction est générée à partir d'une séquence d'images multicadres. Les cartes de salience par image peuvent être prédites en appliquant TASED-Net à une vidéo selon un mode glissant. L'approche proposée suppose que la carte de salience de toute image peut être prédite en prenant en compte un nombre limité d'images précédentes. Les résultats de nos expériences approfondies sur la détection de la salience dans les vidéos confirment cette hypothèse et montrent que notre modèle entièrement convolutif avec méthode d'agrégation temporelle est efficace. TASED-Net surpasse considérablement les approches précédentes de l'état de l'art sur les trois principaux jeux de données à grande échelle pour la détection de la salience dans les vidéos : DHF1K, Hollywood2 et UCFSports. Après une analyse qualitative des résultats, nous constatons que notre modèle est particulièrement performant pour détecter les objets mouvants saillants.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Réseau De Neurones Convolutif

Traitement Vidéo

Segmentation Sémantique

Approche/Framework

Vision Par Ordinateur

Tâche

Kyle Min Jason J. Corso

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Réseau De Neurones Convolutif

Traitement Vidéo

Segmentation Sémantique

Approche/Framework

Vision Par Ordinateur

Tâche

Kyle Min Jason J. Corso

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

TASED-Net : Réseau d'encodeur-décodeur spatial agrégant temporellement pour la détection de la salience vidéo

Kyle Min Jason J. Corso

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

TASED-Net : Réseau d'encodeur-décodeur spatial agrégant temporellement pour la détection de la salience vidéo

Kyle Min Jason J. Corso

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

TASED-Net : Réseau d'encodeur-décodeur spatial agrégant temporellement pour la détection de la salience vidéo

Kyle Min Jason J. Corso

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters