Tutoriel En Ligne丨innovations Importantes Dans La Série YOLO ! L'équipe Tsinghua Lance YOLOE, Qui Peut Détecter Et Segmenter Des Objets Dans Des Scènes Ouvertes En Temps Réel

Depuis sa première sortie en 2015, YOLO (You Only Look Once) est devenu l'un des modèles de détection d'objets en temps réel les plus influents dans le domaine de la vision par ordinateur. Cette technologie de détection de cible de bout en bout basée sur une architecture de détection en une seule étape a été mise à jour plus de dix versions au cours des 10 dernières années. Grâce à son traitement en temps réel d'images de haute précision et à fréquence d'images élevée, il est largement utilisé dans de nombreux domaines tels que la conduite autonome, l'analyse d'images médicales et la vision robotique.
Cependant, bien que les modèles traditionnels de la série YOLO utilisent des réseaux neuronaux convolutifs pour obtenir une détection en temps réel haute performance,Cependant, il s’appuie sur des catégories cibles prédéfinies et manque de flexibilité dans les scénarios ouverts pratiques.
Pour résoudre ce problème, l'équipe de l'Université Tsinghua, basée sur YOLO,Le modèle ouvert de détection et de segmentation d'objets YOLOE est proposé, qui prend en charge trois types de scénarios : invites textuelles, repères visuels et sans invite.Cette capacité multimodale lui permet de comprendre les commandes linguistiques, de voir des images et même de découvrir de nouvelles choses de manière indépendante, parvenant ainsi véritablement à « tout voir en temps réel ».
Actuellement, la section tutoriel du site officiel d'HyperAI a lancé un tutoriel de déploiement en un clic « YOLOE : tout voir en temps réel ». Amis intéressés, venez vivre l'expérience !
Lien du tutoriel :
Essai de démonstration
1. Connectez-vous à hyper.ai, sur la page Tutoriels, sélectionnez YOLOE : Tout voir en temps réel, puis cliquez sur Exécuter ce tutoriel en ligne.


2. Une fois la page affichée, cliquez sur « Cloner » dans le coin supérieur droit pour cloner le didacticiel dans votre propre conteneur.

3. Sélectionnez les images « NVIDIA RTX 4090 » et « PyTorch ». La plateforme OpenBayes a lancé une nouvelle méthode de facturation. Vous pouvez choisir « Payer au fur et à mesure » ou « Forfait journalier/hebdomadaire/mensuel » selon vos besoins. Cliquez sur « Continuer ». Les nouveaux utilisateurs peuvent s'inscrire en utilisant le lien d'invitation ci-dessous pour obtenir 4 heures de RTX 4090 + 5 heures de temps CPU gratuit !
Lien d'invitation exclusif HyperAI (copier et ouvrir dans le navigateur) :
https://go.openbayes.com/9S6Dr


4. Attendez que les ressources soient allouées. Le premier processus de clonage prend environ 2 minutes. Lorsque le statut passe à « En cours d'exécution », cliquez sur la flèche de saut à côté de « Adresse API » pour accéder à la page de démonstration. Étant donné que le modèle est volumineux, il faut environ 3 minutes pour afficher l'interface WebUI, sinon « Bad Gateway » s'affichera. Veuillez noter que les utilisateurs doivent effectuer l'authentification par nom réel avant d'utiliser la fonction d'accès à l'adresse API.


Affichage des effets
La première est la détection d’invite de texte,YOLOE prend en charge la détection et la segmentation des indices de texte pour n'importe quelle catégorie de texte. Le texte saisi dans la figure ci-dessous est « tigre, bus, personne ». Le résultat de la détection est présenté dans la figure de droite, qui identifie clairement le tigre, le bus touristique et les touristes sur la photo. On peut constater que même les touristes ayant la tête bouchée ou se trouvant dans des endroits sombres peuvent être clairement identifiés.

Le deuxième est celui des repères visuels.Après avoir spécifié la cible de détection au moyen de cases/points/formes dessinées à la main/images de référence, des objets de détection similaires peuvent être identifiés avec précision, comme illustré dans la figure suivante :

Enfin, il existe une détection silencieuse entièrement automatique.Il peut identifier automatiquement les objets de la scène, comme illustré dans la figure suivante :

Ce qui précède est le tutoriel recommandé par HyperAI cette fois-ci. Venez l'essayer par vous-même !
Lien du tutoriel :