HyperAI초신경
Back to Headlines

미스트랄, 비용 절반의 오픈소스 AI 오디오 모델 출시

2일 전

미스트랄, 오픈 소스 AI 오디오 모델 Voxtral 출시 AI 시스템의 기능이 계속 발전하면서 음성 인터페이스는 인간과 기계 간의 주요 통신 수단으로 빠르게 자리 잡고 있습니다. 프랑스 AI 스타트업 미스트랄은 이를 감안하여 첫 번째 오픈 소스 오디오 모델을 출시하며, 벽 안의 기업 시스템에 대항하기 위한 노력을 시작했습니다. 지난 화요일, 미스트랄은 비즈니스를 위한 첫 번째 오디오 모델 가족인 'Voxtral'의 출시를 발표했습니다. 이 모델은 "정상적인 생산 환경에서 실제로 사용할 수 있는 음성 인텔리전스"를 제공하는 첫 번째 오픈 모델로 소개되었습니다. 즉, 개발자들은 가격이 저렴하지만 전사가 어려운 오픈 시스템과 기능적이지만 비용이 높고 배포에 대한 제어권이 제한된 폐쇄 시스템 사이에서 선택해야 하는 상황을 벗어날 수 있게 되었습니다. 미스트랄은 Voxtral이 "비교 가능한 솔루션의 절반 미만의 가격"으로 비즈니스에 경제적인 대안을 제공한다고 주장합니다. Voxtral은 최대 30분의 오디오를 전사할 수 있으며, LLM(대형 언어 모델) 기반의 미스트랄 스몰 3.1 버전은 최대 40분까지 이해할 수 있습니다. 사용자는 오디오 내용에 대해 질문하거나 요약을 생성하거나 API를 호출하거나 함수를 실행하는 등의 실시간 동작을 수행할 수 있습니다. 또한 Voxtral은 영어, 스페인어, 프랑스어, 포르투갈어, 힌디어, 독일어, 네덜란드어, 이탈리아어 등 여러 언어를 지원합니다. 미스트랄은 두 가지 버전의 "음성 이해 모델"을 제공합니다. 첫 번째는 240억 매개변수를 가진 Voxtral 스몰로, 생산 규모 배포에 적합하며 ElevenLabs Scribe, GPT-4o-mini, Gemini 2.5 Flash와 경쟁할 수 있다고 합니다. 두 번째는 30억 매개변수를 가진 Voxtral 미니로, 로컬 및 엣지 배포에 적합합니다. 이 모델의 초저가, 최적화된 버전인 Voxtral 미니 트랜스크라이브는 전사 용도에 최적화되어 있으며 OpenAI Whisper보다 가격이 절반 미만인 것으로 알려져 있습니다. 사용자는 Hugging Face에서 API를 무료로 다운로드하거나 미스트랄의 챗봇 'Le Chat'에서 모델을 테스트해볼 수 있습니다. 애플리케이션에 API를 통합하면 분당 0.001달러부터 시작된다고 회사 측은 밝혔습니다. 이번 출시는 미스트랄이 한 달 전 마규스트랄(Magistral) 출시를 발표한 이후 이루어졌습니다. 마규스트랄은 단계별로 문제를 해결하여 신뢰성을 향상시키는 첫 번째 추론 모델 가족입니다. 유럽의 선두 AI 기업 중 하나인 미스트랄은 오픈 소스 AI 모델을 적극적으로 지지하는 것으로 잘 알려져 있습니다. 지난 달 TechCrunch는 미스트랄이 아부다비의 MGX 펀드 등 여러 투자자로부터 최대 10억 달러의 자금 유치를 논의하고 있다는 보도를 전했습니다. 전문가들의 평가는 미스트랄의 이러한 노력이 AI 기술의 접근성을 크게 높일 것이라는 점에 초점을 맞추고 있습니다. 오픈 소스 모델은 개발자들이 비용 효율적으로 고급 기능을 활용할 수 있게 하며, 이는 기업들에게도 큰 혜택이 될 것입니다. 미스트랄은 이러한 기술을 통해 AI 산업의 발전과 혁신을 촉진하고자 하는 의지를 드러냈습니다. 회사는 이미 다양한 AI 모델 개발 경험을 통해 기술력을 인정받고 있으며, 이 새로운 모델 출시를 통해 시장에서 더욱 강한 입지를 다질 것으로 예상됩니다.

Related Links