HyperAIHyperAI
il y a 2 mois

FODVid : Découverte d'objets guidée par le flux dans les vidéos

Singh, Silky ; Deshmukh, Shripad ; Sarkar, Mausoom ; Jain, Rishabh ; Hemani, Mayur ; Krishnamurthy, Balaji
FODVid : Découverte d'objets guidée par le flux dans les vidéos
Résumé

La segmentation d'objets dans une vidéo est un défi en raison des subtilités telles que le flou de mouvement, la parallaxe, les occultations et les variations d'éclairage. Au lieu d'aborder ces subtilités séparément, nous nous concentrons sur la construction d'une solution généralisable qui évite le surapprentissage aux particularités individuelles. Une telle solution permettrait également de faire des économies considérables sur les ressources nécessaires à l'annotation manuelle des corpus vidéo. Pour résoudre la segmentation d'objets dans une vidéo (VOS) dans un cadre non supervisé, nous proposons un nouveau pipeline (FODVid) basé sur l'idée de guider les résultats de segmentation à l'aide de coupures graphiques guidées par le flux et de cohérence temporelle. En substance, nous concevons un modèle de segmentation intégrant les similarités d'apparence intra-image et de flux, ainsi que la continuité temporelle inter-images des objets considérés. Nous effectuons une analyse expérimentale approfondie de notre méthodologie simple sur le benchmark vidéo standard DAVIS16. Bien que simple, notre approche produit des résultats comparables (dans une fourchette d'environ 2 mIoU) aux meilleures approches existantes en VOS non supervisée. La simplicité et l'efficacité de notre technique ouvrent de nouvelles perspectives pour la recherche dans le domaine vidéo.

FODVid : Découverte d'objets guidée par le flux dans les vidéos | Articles de recherche récents | HyperAI