HyperAIHyperAI
Back to Headlines

ClipTagger-12b : Un modèle vidéo open-source qui bat Claude 4 à moindre coût

il y a un mois

Grass et Inference.net lancent ClipTagger-12b, un modèle d’annotation vidéo surpassant Claude 4 NEW YORK – (BUSINESS WIRE) – Grass et Inference.net ont annoncé aujourd’hui le lancement de ClipTagger-12b, un nouveau modèle d’annotation vidéo conçu pour identifier avec précision les actions, objets et logos dans des séquences vidéo. Développé grâce à une collaboration entre les deux entreprises, ce modèle s’inscrit dans une démarche visant à améliorer les capacités de perception des systèmes d’intelligence artificielle, avec des applications concrètes dans des domaines variés tels que les véhicules autonomes ou la robotique en entrepôt. Formé sur un sous-ensemble de plus d’un milliard de vidéos provenant du web public, collectées par Grass, ClipTagger-12b a été entraîné par Inference.net et hébergé sur le réseau distribué de calcul d’Inference.net. Cette infrastructure permet une exécution à grande échelle, tout en garantissant une faible latence et un coût réduit. Les tests comparatifs montrent que ClipTagger-12b bat les performances de Claude 4 et GPT-4.1 sur des métriques clés d’annotation comme ROUGE et BLEU, tout en étant jusqu’à 17 fois moins coûteux à exécuter. Ces résultats démontrent que des modèles d’avant-garde peuvent être développés à moindre coût grâce à une combinaison de données de qualité et d’ingénierie efficace. « Il est tout à fait possible de former des modèles d’exception à faible coût, à condition d’avoir accès à de bonnes données et une architecture bien conçue », affirme Sam Hogan, PDG d’Inference.net. Andrej Radonjic, PDG de Wynd Labs, souligne l’importance de l’ouverture du web : « Nous pensons que l’avenir de l’intelligence artificielle repose sur la préservation d’un web ouvert et sur le développement des infrastructures nécessaires pour transformer ce flux de données en ressources d’apprentissage pour les modèles. Ce projet en est un exemple concret. » Ce lancement illustre comment des équipes spécialisées peuvent désormais concevoir et déployer des modèles performants autrefois réservés aux grands laboratoires d’IA, rendant ainsi l’annotation vidéo avancée accessible à un plus large éventail de développeurs et d’entreprises. ClipTagger-12b est désormais disponible en ligne via l’API d’Inference.net. Les poids du modèle ainsi que des ressources complémentaires sont également accessibles sur Hugging Face. Les chercheurs peuvent postuler pour obtenir jusqu’à 10 000 dollars de crédits via le site inference.net/grants. À propos de Grass Grass est une application téléchargeable qui permet à tout utilisateur de partager son bande passante inutilisée, alimentant ainsi un réseau mondial utilisé pour collecter des données réelles du monde réel, essentielles au développement de modèles d’IA. À propos d’Inference.net Inference.net est un réseau distribué de calcul optimisé pour exécuter à grande échelle des modèles d’intelligence artificielle, permettant aux développeurs de déployer et de servir leurs modèles sans dépendre des infrastructures cloud centralisées.

Related Links