HyperAIHyperAI

Command Palette

Search for a command to run...

NODIS : Compréhension des scènes par équations différentielles ordinaires neuronales

Cong Yuren Hanno Ackermann Wentong Liao Michael Ying Yang Bodo Rosenhahn

Résumé

L'interprétation sémantique des images constitue un défi majeur en vision par ordinateur. Elle consiste non seulement à détecter tous les objets présents dans une image, mais également à identifier toutes les relations qui les lient. Les objets détectés, leurs étiquettes et les relations découvertes peuvent être utilisés pour construire un graphe de scène, offrant ainsi une interprétation sémantique abstraite de l'image. Dans les travaux antérieurs, les relations étaient identifiées en résolvant un problème d'affectation formulé sous forme de programmes linéaires mixtes-entiers (MILP). Dans ce travail, nous interprétons cette formulation comme une équation différentielle ordinaire (ODE). L'architecture proposée réalise l'inférence de graphe de scène en résolvant une variante neuronale d'une ODE par apprentissage end-to-end. Elle atteint des résultats de pointe sur les trois tâches de référence : génération de graphe de scène (SGGen), classification (SGCls) et détection de relations visuelles (PredCls) sur le benchmark Visual Genome.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp
NODIS : Compréhension des scènes par équations différentielles ordinaires neuronales | Articles | HyperAI