Open-TransMind : Un Nouveau Point de Référence et un Nouveau Jeu de Données pour le Défi du Premier Modèle Fondamental de la Mobilité Intelligente

Depuis quelques années, grâce à l’amélioration continue de la puissance de calcul et des algorithmes d’apprentissage profond, les modèles fondamentaux (foundation models) ont connu une popularité croissante. En raison de leurs capacités puissantes et de leurs performances exceptionnelles, cette technologie est de plus en plus adoptée et appliquée dans un grand nombre d’industries. Dans le secteur des transports intelligents, l’intelligence artificielle fait face à des défis typiques tels que le peu d’exemples (few-shot learning), une faible généralisation et un manque de techniques multi-modales. La technologie des modèles fondamentaux peut considérablement atténuer ces problèmes. Afin de répondre à ces enjeux, nous avons conçu le 1er Défi des Modèles Fondamentaux, dont l’objectif est de renforcer la popularité de cette technologie dans les scénarios de transport et de stimuler le développement rapide du secteur des transports intelligents. Ce défi se déroule en deux catégories : recherche d’images tout-en-un et recherche d’images multi-modales. Par ailleurs, nous proposons une nouvelle base de référence (baseline) et un benchmark pour ces deux catégories, intitulés Open-TransMind. Selon nos connaissances, Open-TransMind est le premier modèle fondamental open-source dédié au transport, offrant des capacités multi-tâches et multi-modales. En outre, Open-TransMind parvient à des performances de pointe sur des jeux de données de détection, de classification et de segmentation dans des scénarios de transport. Le code source est disponible à l’adresse suivante : https://github.com/Traffic-X/Open-TransMind.