HyperAIHyperAI

Command Palette

Search for a command to run...

ElevenLabs-Chef sieht AI-Audio-Modelle als bald kommodifiziert

ElevenLabs-Chef Mati Staniszewski geht davon aus, dass KI-Audio-Modelle im Laufe der Zeit zu „Commodities“ werden – eine bemerkenswerte Aussage für ein Unternehmen, das sich aktuell intensiv auf die Entwicklung solcher Modelle konzentriert. In einer Rede auf der TechCrunch Disrupt 2025 betonte er, dass die derzeitigen technologischen Fortschritte in der Modellarchitektur, insbesondere in der Audioqualität, bereits erheblich vorangeschritten seien. In den nächsten ein bis zwei Jahren werde die Branche weiterhin von spezialisierten, hochwertigen KI-Modellen geprägt sein, die signifikante Unterschiede in Klang, Natürlichkeit und Sprachverarbeitung ermöglichen. Langfristig, so Staniszewski, werden sich die Unterschiede zwischen den Modellen jedoch verringern, da die Grundtechnologien allgemein verfügbar werden und die Leistungsgrenzen sich angleichen. Dennoch erwartet er, dass bestimmte Stimmen oder Sprachen weiterhin spezifische Vorteile für bestimmte Modelle aufweisen werden. Trotz der Erwartung einer Kommodifizierung betont Staniszewski, dass derzeit der Aufbau eigener Modelle der entscheidende Wettbewerbsvorteil ist. Schlechte KI-generierte Sprache bleibt ein kritischer Hindernis für Anwendungen, und nur durch die direkte Entwicklung und Optimierung der Modelle könne dies behoben werden. In der Zwischenzeit werden auch andere Unternehmen ähnliche Fortschritte erzielen, wodurch der Wettbewerb zunehmend auf Anwendungsfällen, nicht mehr auf der Modellarchitektur, basieren wird. Gleichzeitig sieht er eine klare Trendwende hin zu multimodalen Systemen: KI wird künftig nicht nur Audio, sondern auch Video oder interaktive LLM-basierte Dialoge gleichzeitig erzeugen. Als Beispiel nannte er Googles Veo 3, das die Integration von Audio, Video und Sprachmodellen demonstriert. ElevenLabs plant, sich strategisch auf Partnerschaften und Open-Source-Technologien zu stützen, um seine audio-spezifischen Stärken mit den Fähigkeiten anderer Modelle zu kombinieren. Ziel ist es, nicht nur Modelle zu bauen, sondern auch innovative Anwendungen zu schaffen, die den vollen Nutzen aus der KI-Integration ziehen. „So wie Software und Hardware das Geheimnis von Apple waren, glauben wir, dass Produkt und KI das Geheimnis für die besten Anwendungsfälle der nächsten Generation sein werden“, sagte Staniszewski. Damit positioniert sich das Unternehmen als Akteur, der über die reine Modellentwicklung hinausgeht und auf die Schaffung wertvoller, nutzerzentrierter Lösungen setzt. Industrieexperten sehen in Staniszewskis Aussage eine Realitätsnähe: Während die Modellentwicklung heute noch entscheidend ist, wird der Wettbewerb künftig zunehmend auf der Integration und Anwendung liegen. ElevenLabs, gegründet 2022 und bekannt für hochrealistische Sprachsynthese, hat bereits mit Unternehmen wie Spotify und Netflix zusammengearbeitet. Die Strategie, sich auf Anwendungen zu konzentrieren, könnte den Weg für nachhaltige Marktführerschaft bahnen – auch wenn die zugrundeliegenden Modelle eines Tages standardisiert sein werden.

Verwandte Links