Chatterbox TTS : Le Nouveau Modèle Open Source Préféré aux Systèmes Commerciaux comme ElevenLabs
Nous sommes heureux de présenter Chatterbox, le premier modèle de synthèse vocale open source (Text-to-Speech, TTS) prêt pour une utilisation en production développé par Resemble AI. Licencié sous la license MIT, Chatterbox a été évalué contre des systèmes propriétaires de pointe comme ElevenLabs, et il est fréquemment préféré lors de comparaisons directes. Qu'il s'agit de créations de mèmes, de vidéos, de jeux ou d'agents IA, Chatterbox donne vie à votre contenu. Il s'agit également du premier modèle TTS open source à prendre en charge le contrôle de l'exagération émotionnelle, une fonctionnalité puissante qui permet de créer des voix uniques et marquantes. Vous pouvez essayer Chatterbox dès maintenant sur notre application Hugging Face Gradio. Si vous appréciez ce modèle mais avez besoin de le mettre à l'échelle ou de l'ajuster pour une meilleure précision, jetez un œil à notre service TTS compétitivement tarifé. Il offre des performances fiables avec une latence ultra-basse inférieure à 200 millisecondes, idéales pour une utilisation en production dans des agents, des applications ou des médias interactifs. Détails clés Conseils Assurez-vous de consulter les fichiers example_tts.py et example_vc.py pour plus d'exemples d'utilisation. N'utilisez pas ce modèle à des fins malveillantes. Les prompts utilisés proviennent de données disponibles librement sur Internet. Installation Chatterbox a été développé et testé sous Python 3.11 sur Debian 11. Les versions des dépendances sont spécifiées dans le fichier pyproject.toml pour garantir une cohérence maximale. Vous pouvez installer le modèle via pip ou du code source : Installation via pip : bash pip install git+https://github.com/resemble-ai/chatterbox Installation depuis le code source : 1. Clonez le dépôt GitHub : bash git clone https://github.com/resemble-ai/chatterbox 2. Accédez au répertoire du projet : bash cd chatterbox 3. Installez les dépendances requises : bash pip install -r requirements.txt En installant depuis le code source, vous avez la possibilité de modifier le code et les dépendances selon vos besoins. Utilisation Pour utiliser Chatterbox, consultez les fichiers exemples example_tts.py et example_vc.py. Ces scripts vous guideront à travers les différentes fonctionnalités et options du modèle. Langues supportées Actuellement, Chatterbox ne prend en charge que l'anglais. Marquage responsable de l'IA Tous les fichiers audio générés par Chatterbox incluent le marqueur d'eau neural de Resemble AI, appelé Perth (Perceptual Threshold). Ce marqueur d'eau est imperceptible aux utilisateurs finaux mais résiste à la compression MP3, à l'édition audio et aux manipulations courantes tout en offrant une précision de détection quasi-parfaite de 100%. Extraction du marqueur d'eau Pour vérifier la présence du marqueur d'eau, vous pouvez utiliser le script suivant : ```python from resemble.core import extract_watermark Chemin vers le fichier audio à analyser audio_path = "path/to/your/audio/file.mp3" Extraction du marqueur d'eau watermark = extract_watermark(audio_path) Affichage du contenu du marqueur d'eau print(watermark) ``` Communauté officielle Rejoignez-nous sur Discord pour discuter, partager et collaborer avec d'autres utilisateurs de Chatterbox. Ensemble, nous pouvons construire de nouvelles innovations impressionnantes ! Déclaration de responsabilité Ce modèle a été conçu pour des usages responsables et éthiques. Les prompts utilisés pour entraîner et tester le modèle proviennent de données librement disponibles sur Internet. Nous vous encourageons fortement à ne pas utiliser ce modèle à des fins malveillantes ou non éthiques. En adoptant Chatterbox, vous bénéficiez d'un outil de synthèse vocale performant et polyvalent, parfaitement adapté pour des projets variés. Que vous soyez développeur, créateur de contenu ou chercheur, Chatterbox offre de nombreuses possibilités d'innovation et d'amélioration de vos productions.