HyperAIHyperAI

Command Palette

Search for a command to run...

무료 CPU 튜토리얼 | 8,800개의 별점을 획득한 Supertonic-3 TTS 모델은 약 9,900만 개의 파라미터만으로 31개 언어를 지원합니다.

Featured Image

생성형 AI가 멀티모달 방식으로 발전함에 따라, TTS(텍스트 음성 변환) 또한 점차 "클라우드 기반 기능"에서 "로컬 기능"으로 전환되고 있습니다. 과거에는 고품질 TTS 시스템을 구현하기 위해 대규모 모델, 클라우드 기반 추론, 복잡한 배포 프로세스가 필수적이었습니다. 이러한 방식은 자연스러운 음성을 제공했지만, 지연 시간, 비용, 개인정보 보호와 관련된 문제점을 야기했습니다. 특히 모바일 기기, 웹 브라우저, 엣지 하드웨어와 같은 환경에서는 낮은 리소스 소비로 실시간 고품질 다국어 음성 생성을 달성하는 것이 업계의 새로운 과제로 떠오르고 있습니다.

올해 5월에,Supertone 팀은 경량 다국어 텍스트 음성 변환 모델인 Supertonic-3를 오픈 소스로 공개했으며, 이 모델은 이미 GitHub에서 8,800개의 별을 받았습니다.이 모델은 ONNX 런타임을 기반으로 구축되었으며 완전한 로컬 작동을 지원합니다. 클라우드 API를 호출하거나 GPU에 의존하지 않고 CPU 환경에서 실시간 음성 합성을 완료할 수 있습니다.

수십억 개의 매개변수를 가진 현재의 많은 오픈 소스 TTS 시스템과 비교했을 때, Supertonic-3의 주목할 만한 특징은 "작지만 완벽하다"는 점입니다.이 모델은 전체적으로 약 9,900만 개의 매개변수만 가지고 있지만, 31개 언어, 10가지 사전 설정 음색을 지원하며, 긴 텍스트 분할, 무음 구간 제어, 얼굴 표정 태그 지정과 같은 기능을 갖추고 있습니다.예를 들어, 개발자는 다음과 같은 작업을 수행할 수 있습니다... , , [태그 목록]과 같은 태그를 사용하면 추가적인 오디오 참조나 복잡한 프롬프트 엔지니어링 없이도 생성된 음성에 더욱 자연스러운 감정과 멈춤을 추가할 수 있습니다.

공식 발표에 따르면, 이 기술은 추론 속도가 매우 빨라 웹페이지 전체를 1초 안에 오디오로 변환할 수 있으며, 추가적인 후처리 없이 바로 재생할 수 있는 고품질 44.1kHz, 16비트 WAV 파일을 출력합니다. 로컬 AI 비서, 오프라인 리더, 음성 방송 시스템 또는 다국어 콘텐츠 도구를 개발하려는 개발자들에게 이러한 "경량 + 멀티 플랫폼" 솔루션은 점점 더 매력적인 선택지가 되고 있습니다.

최근에,HyperAI 공식 웹사이트(hyper.ai)의 튜토리얼 섹션에 "Supertonic-3: 경량 로컬 다국어 음성 합성 시스템"이 추가되었으며, 환경 설정이 완료되었습니다.Free CPU를 사용하여 고품질 TTS 모델을 무료로 경험해 보세요.

온라인으로 실행:

https://go.hyper.ai/Mr31r

데모 예제

더 많은 온라인 튜토리얼:

https://hyper.ai/notebooks

더 자세한 정보를 원하시면 저희 공식 웹사이트를 방문해 주세요.

https://hyper.ai

데모 실행

1. hyper.ai 홈페이지에 접속한 후, "튜토리얼" 페이지를 선택하거나 "더 많은 튜토리얼 보기"를 클릭하고, "Supertonic-3: 경량 로컬 다국어 음성 합성 시스템"을 선택한 다음, "이 튜토리얼 실행"을 클릭합니다.

2. 페이지가 리디렉션된 후 오른쪽 상단의 "복제"를 클릭하여 튜토리얼을 자신의 컨테이너로 복제합니다.

참고: 페이지 오른쪽 상단에서 언어를 변경할 수 있습니다. 현재 중국어와 영어로만 제공됩니다. 이 튜토리얼에서는 영어로 된 단계를 안내합니다.

3. "Free CPU"와 "PyTorch" 이미지를 선택하고 "작업 실행 계속"을 클릭합니다.

HyperAI는 신규 사용자를 위한 가입 보너스를 제공합니다. 단 $1로 20시간 동안 RTX 5090 컴퓨팅 파워를 이용할 수 있으며(정가는 $7), 이 리소스는 무기한으로 사용 가능합니다.

4. 리소스 할당이 완료될 때까지 기다립니다. 상태가 "실행 중"으로 변경되면 "워크스페이스 열기"를 클릭하여 Jupyter 워크스페이스에 들어갑니다.

효과 표시

1. 페이지가 리디렉션된 후 왼쪽에 있는 README 파일을 클릭하고 상단의 실행을 클릭합니다.

2. 과정이 완료되면 오른쪽에 있는 API 주소를 클릭하여 데모 페이지로 이동하세요.