Resemble AI, 오픈소스 Chatterbox TTS 공개

GitHub에서 Resemble AI가 공개한 Chatterbox는 최고 수준의 오픈 소스 음성 합성(TTS) 모델입니다. MIT 라이선스 하에 배포되며, ElevenLabs와 같은 주요 폐쇄 소스 시스템과 비교해도 일관적으로 우수한 성능을 보여줍니다. Chatterbox는 메모, 비디오, 게임, AI 에이전트 등 다양한 콘텐츠를 더 생동감 있게 만들어주는 역할을 합니다. 특히, 감정 과장 제어 기능을 지원하는 첫 번째 오픈 소스 TTS 모델로, 이 기능은 귀하의 목소리를 돋보이게 만드는 강력한 도구입니다. Hugging Face Gradio 앱에서 지금 바로 체험해 보세요. Chatterbox는 단순히 모델을 사용하는 것 이상의 가치를 제공합니다. 대규모로 확장하거나 더 높은 정확도로 조정이 필요하다면, 우리公司的竞争性定价的TTS服务（链接）可以提供可靠的表现和超低延迟（低于200毫秒），非常适合在代理、应用程序或交互媒体中生产使用。 주요 사항 라이선스: MIT 라이선스 비교 성능: ElevenLabs와 같은 주요 폐쇄 소스 시스템과 대조평가에서 일관적으로 우수한 성능 특징: 감정 과장 제어 기능 지원 지원 언어: 현재 영어만 지원 응용 분야: 메모, 비디오, 게임, AI 에이전트 등 설치 방법 Chatterbox는 Python 3.11과 Debian 11 운영 체제에서 개발 및 테스트되었습니다. pyproject.toml 파일에서 의존성 버전이 고정되어 있어 일관성을 유지합니다. 소스에서 설치할 수도 있으며, 설치 모드에서 코드나 의존성을 수정할 수 있습니다. bash pip install chatterbox-tts 사용 방법 예제 스크립트인 example_tts.py와 example_vc.py를 참고하세요. 책임 있는 AI를 위한 내장 워터마크 Chatterbox는 모든 오디오 파일에 Resemble AI의 Perth(감지 임계치) 워터마커를 포함합니다. 이 워터마커는 MP3 압축, 오디오 편집, 일반적인 조작을 견디면서도 거의 100%의 검출 정확도를 유지합니다. 워터마크를 추출하려면 다음 스크립트를 사용하세요. 공식 Discord Discord에 참여하여 함께 멋진 것을 만들어요! 주의사항 이 모델을 부적절한 용도로 사용하지 마세요. 프롬프트는 인터넷에서 자유롭게 이용 가능한 데이터에서 수집됩니다. 업계 인사들의 평가 Chatterbox의 출시는 TTS 기술의 발전에 중요한 이정표가 되고 있다. 이 모델은 오픈 소스 커뮤니티에게 뛰어난 성능과 혁신적인 기능을 제공하며, especially its emotion exaggeration control feature, sets it apart from other models. Resemble AI는 이러한 기술을 통해 AI 음성 합성 분야에서 선구적인 역할을 하고 있으며, 이 모델은 그들의 노력을 잘 반영하고 있다. 또한, 내장된 워터마킹 기능은 책임 있는 AI 사용을 촉진하는 중요한 요소로 평가된다.

Resemble AI, 오픈소스 Chatterbox TTS 공개

Related Links