HyperAI

Image Captioning

La légendage d'images vise à décrire précisément le contenu des images d'entrée en utilisant des techniques de génération de langage naturel. Cette tâche intègre des technologies des domaines de la vision par ordinateur et du traitement du langage naturel, en employant généralement un cadre encodeur-décodeur pour transformer les informations visuelles en représentations intermédiaires, qui sont ensuite décodées en textes descriptifs. Les principaux critères d'évaluation incluent BLEU et CIDER, tandis que les jeux de données couramment utilisés pour cette tâche sont nocaps et COCO. Le légendage d'images présente une valeur d'application importante dans des domaines tels que l'aide aux personnes malvoyantes pour comprendre les images, le marquage automatique de contenu et la recherche d'images intelligente.