Hugging Face lance AI Sheets : un outil no-code pour transformer vos données avec des modèles d’IA ouverts
Hugging Face présente AI Sheets, un nouvel outil open source conçu pour créer, enrichir et transformer des jeux de données à l’aide de modèles d’intelligence artificielle, sans aucune connaissance en codage. Disponible directement dans le navigateur ou déployable localement, cet outil s’intègre parfaitement à l’écosystème Hugging Face, permettant d’accéder à des milliers de modèles open source via des fournisseurs d’inférence ou en les exécutant localement — y compris des modèles comme gpt-oss d’OpenAI. Son interface ressemble à un tableur classique, favorisant l’expérimentation rapide à partir de petits jeux de données avant de lancer des pipelines de génération plus longs ou coûteux. AI Sheets permet de créer de nouvelles colonnes en écrivant simplement des prompts, avec une capacité d’itération illimitée. Les utilisateurs peuvent modifier manuellement des cellules ou valider des résultats pour enseigner au modèle ce qu’ils souhaitent, ce qui agit comme une forme de fine-tuning des prompts en temps réel. Les cas d’usage sont variés : comparaison de modèles, amélioration de prompts pour des applications spécifiques, nettoyage de données, classification, analyse de contenu, enrichissement de jeux de données (ex. : ajout de codes postaux), ou encore génération de données synthétiques pour préserver la confidentialité. Pour commencer, deux options sont proposées : créer un jeu de données à partir d’une description naturelle (mode « prompt-to-dataset ») ou importer un fichier existant au format CSV, TSV, XLS ou Parquet. L’outil génère automatiquement un schéma et 5 lignes d’exemple, que l’on peut étendre jusqu’à 1 000 lignes. Une fois les données chargées, l’utilisateur peut ajouter des colonnes intelligentes, modifier les résultats, activer la recherche web pour des données précises, ou changer de modèle ou de fournisseur d’inférence. Les cellules modifiées ou validées deviennent des exemples de peu de tirage (few-shot) utilisés lors des régénérations ultérieures. À la fin du processus, le jeu de données final peut être exporté vers le Hub Hugging Face, générant automatiquement un fichier de configuration réutilisable. Ce dernier permet de lancer des pipelines de génération à grande échelle via HF Jobs, en spécifiant le nombre de lignes à générer, les modèles à utiliser et les prompts. Des exemples concrets montrent comment utiliser AI Sheets pour tester des modèles de génération de code, catégoriser des questions, ou évaluer des sorties via un modèle jugé (LLM-as-Judge). Des experts du secteur soulignent que cette solution représente une avancée majeure pour les chercheurs, data scientists et développeurs souhaitant accélérer leur workflow de préparation de données. Son approche no-code, combinée à l’intégration fluide avec l’écosystème open source, en fait un outil idéal pour les projets de recherche, de fine-tuning ou de création de benchmarks. Hugging Face recommande de souscrire à l’abonnement PRO pour bénéficier de 20 fois plus de crédits d’inférence mensuels, optimisant ainsi les performances locales. L’outil est disponible gratuitement en version cloud, ou téléchargeable depuis GitHub pour une utilisation autonome.