il y a 8 mois

Résumé

Récemment, la détection faiblement supervisée d'anomalies vidéo (WS-VAD) est apparue comme une nouvelle direction de recherche visant à identifier des événements anormaux tels que la violence et la nudité dans les vidéos en utilisant uniquement des étiquettes au niveau de la vidéo. Cependant, cette tâche présente des défis considérables, notamment le traitement de l'information modale déséquilibrée et la distinction cohérente entre les caractéristiques normales et anormales. Dans cet article, nous abordons ces défis et proposons un cadre multi-modal WS-VAD pour détecter avec précision des anomalies telles que la violence et la nudité. Au sein de ce cadre proposé, nous introduisons un nouveau mécanisme de fusion appelé Adaptateur de Fusion Inter-modale (Cross-modal Fusion Adapter - CFA), qui sélectionne dynamiquement et améliore les caractéristiques audiovisuelles hautement pertinentes par rapport à la modalité visuelle. De plus, nous présentons une Attention Graphique Lorentzienne Hyperbolique (Hyperbolic Lorentzian Graph Attention - HLGAtt) pour capturer efficacement les relations hiérarchiques entre les représentations normales et anormales, ce qui améliore ainsi la précision de séparation des caractéristiques. À travers des expériences approfondies, nous montrons que le modèle proposé atteint des résultats d'état de l'art sur des jeux de données de référence pour la détection de violence et de nudité.

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Multimodal

Représentation Multimodale

Reconnaissance D'action

Multimodal

Vision Par Ordinateur

Tâche

Ayush Ghadiya Purbayan Kar Vishal Chudasama Pankaj Wasnik

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

il y a 8 mois

Multimodal

Représentation Multimodale

Reconnaissance D'action

Multimodal

Vision Par Ordinateur

Tâche

Ayush Ghadiya Purbayan Kar Vishal Chudasama Pankaj Wasnik

Résumé

PDF source

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Fusion intermodale et mécanisme d'attention pour la détection faiblement supervisée d'anomalies vidéo | Articles | HyperAI

Command Palette

Fusion intermodale et mécanisme d'attention pour la détection faiblement supervisée d'anomalies vidéo

Ayush Ghadiya Purbayan Kar Vishal Chudasama Pankaj Wasnik

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Fusion intermodale et mécanisme d'attention pour la détection faiblement supervisée d'anomalies vidéo

Ayush Ghadiya Purbayan Kar Vishal Chudasama Pankaj Wasnik

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Fusion intermodale et mécanisme d'attention pour la détection faiblement supervisée d'anomalies vidéo

Ayush Ghadiya Purbayan Kar Vishal Chudasama Pankaj Wasnik

Résumé

Créer de l'IA avec l'IA

HyperAI Newsletters