Ensemble De Données Tactiles Multimodales Et Multicapteurs TacQuad
Date
Taille
URL de publication
Licence
MIT
Catégories
TacQuad est un ensemble de données tactiles multimodales alignées et multi-capteurs collectées à partir de 4 types de capteurs tactiles visuels (GelSight Mini, DIGIT, DuraGel et Tac3D). Cet ensemble de données a été publié en 2025 par une équipe de recherche de l'Université Renmin de Chine, de l'Université des sciences et technologies de Wuhan et de l'Université des postes et télécommunications de Pékin.AnyTouch : apprentissage d'une représentation statique-dynamique unifiée sur plusieurs capteurs visuo-tactiles".
Il fournit une solution plus complète à la faible standardisation des capteurs tactiles visuels en fournissant des données d'alignement multi-capteurs avec du texte et des images visuelles. Cela permet explicitement au modèle d'apprendre les attributs tactiles de niveau sémantique et les caractéristiques indépendantes du capteur, formant ainsi un espace de représentation multi-capteurs unifié grâce à une approche basée sur les données. Cet ensemble de données comprend deux sous-ensembles de données appariées avec différents niveaux d'alignement :
- Alignement spatio-temporel précis des données :Ces données sont collectées par quatre capteurs appuyant sur le même objet au même endroit et à la même vitesse. Il contient un total de 17 524 cadres de contact provenant de 25 objets, qui peuvent être utilisés pour des tâches à granularité fine telles que la génération de capteurs croisés.
- Données d'alignement spatial à gros grains :Ces données ont été collectées manuellement, avec quatre capteurs appuyant au même endroit sur le même objet, mais sans garantie d'alignement temporel. Il contient 55 082 cadres de contact provenant de 99 objets, y compris des scènes intérieures et extérieures, qui peuvent être utilisés pour des tâches de correspondance entre capteurs.
