HyperAIHyperAI

Command Palette

Search for a command to run...

Génération de graphe de scène sans localisation

Ege Özsoy Felix Holm Mahdi Saleh Tobias Czempiel Chantal Pellegrini Nassir Navab Benjamin Busam

Résumé

La génération de graphes de scène (SGG) est une tâche de compréhension visuelle visant à décrire une scène sous la forme d’un graphe reliant des entités et leurs relations mutuelles. Les approches existantes reposent sur des étiquettes de localisation, telles que des boîtes englobantes ou des masques de segmentation, ce qui augmente les coûts d’annotation et limite l’expansion des jeux de données. En remarquant que de nombreuses applications n’exigent pas de données de localisation, nous rompons cette dépendance en introduisant une nouvelle tâche : la génération de graphes de scène sans localisation (LF-SGG). Ce nouveau cadre vise à prédire les instances d’entités ainsi que leurs relations, sans calcul explicite de leur localisation spatiale. Pour évaluer objectivement cette tâche, il est nécessaire de comparer les graphes prédits aux graphes de référence. Nous résolvons ce problème NP-dur grâce à un algorithme de branchement efficace. Par ailleurs, nous proposons la première méthode pour LF-SGG, nommée Pix2SG, basée sur une modélisation séquentielle autoregressive. Nous démontrons l’efficacité de notre approche sur trois jeux de données de génération de graphes de scène ainsi que sur deux tâches en aval : la recherche d’images et la réponse à des questions visuelles. Nos résultats montrent que notre méthode est compétitive par rapport aux approches existantes, tout en n’exploitant pas d’indices de localisation.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp