AI audio models seront bientôt commoditisées, selon le PDG d’ElevenLabs
Le fondateur et PDG d’ElevenLabs, Mati Staniszewski, affirme que les modèles d’intelligence artificielle audio deviendront « commodités » au fil du temps, une remarque significative pour une entreprise dont l’activité repose précisément sur le développement de ces modèles. Intervenant sur scène lors de la conférence TechCrunch Disrupt 2025 mardi, Staniszewski a exposé ses visions à court et à long terme sur l’évolution du domaine de l’IA audio. Selon lui, ses équipes ont déjà surmonté plusieurs défis liés à l’architecture des modèles, un effort qui restera central dans les prochains mois. « À long terme, cela va se commodifier — dans les deux prochaines années », a-t-il déclaré. « Même s’il subsistera des différences — ce qui sera probablement vrai pour certaines voix, certains langages — ces écarts s’amenuiseront progressivement. » Interrogé sur la logique de développer des modèles s’il prévoit leur commodification future, Staniszewski a expliqué que, dans l’immédiat, disposer de modèles propriétaires reste « l’avantage le plus important et le plus transformateur disponible aujourd’hui ». En effet, si les voix générées ou les interactions ne sonnent pas naturelles, c’est encore un problème critique à résoudre. « La seule façon de le faire, c’est de construire ses propres modèles », a-t-il ajouté, soulignant que d’autres acteurs finiront par atteindre un niveau similaire à terme. Il a également noté que les entreprises cherchant des applications fiables et évolutives continueront probablement à choisir des modèles adaptés à chaque cas d’usage. Toutefois, dans les prochaines années, une tendance croissante vers des approches multimodales ou intégrées émergera. « Vous allez produire de l’audio et de la vidéo en même temps, ou de l’audio et des modèles de langage (LLM) dans un cadre conversationnel », a-t-il précisé, citant comme exemple Google Veo 3, qui illustre les possibilités offertes par la combinaison de plusieurs modèles. ElevenLabs prévoit donc de renforcer sa stratégie en nouant des partenariats avec d’autres entreprises et en s’appuyant sur des technologies open source, afin de combiner son expertise audio avec les forces d’autres modèles. L’objectif, selon Staniszewski, est de se concentrer à la fois sur le développement de modèles et sur la création d’applications concrètes pour générer de la valeur à long terme. « Comme le logiciel et le matériel ont été la clé du succès d’Apple, nous pensons que le produit et l’IA seront la combinaison magique pour les meilleures applications de cette génération », a-t-il conclu.
