HyperAIHyperAI
Back to Headlines

Meta kauft KI-Audio-Startup WaveForms, um Llama-Sprachfähigkeiten zu stärken

vor 5 Tagen

Meta hat die junge KI-Start-up-Firma WaveForms für eine unbekannte Summe übernommen, wie „The Information“ berichtet. Die Akquisition ist Teil der strategischen Ausweitung von Meta’s neu gegründetem AI-Team „Superintelligence Labs“ und markiert das zweite große AI-Audio-Deal innerhalb eines Monats, nachdem Meta zuvor PlayAI gekauft hatte. WaveForms, gegründet im Dezember 2024, hatte bereits im Frühjahr eine 40-Millionen-Dollar-Samenfinanzierung von Andreessen Horowitz (a16z) abgeschlossen, die das Unternehmen auf einen vorherigen Wert von 200 Millionen US-Dollar schätzte. Zwei der drei Gründer, Alexis Conneau und Coralie Lemaitre, sollen nun bei Meta arbeiten. Conneau, ehemaliger Forscher bei Meta und OpenAI, war maßgeblich an der Entwicklung des GPT-4o Advanced Voice Mode beteiligt, einer fortschrittlichen Sprachmodelltechnologie, die menschenähnliche, kontextsensitive Antworten in Echtzeit ermöglicht. Lemaitre, ehemalige Strategin bei Google für Werbung, bringt wertvolle Erfahrung im Produktmanagement und Business-Entwicklung mit. Ob auch der dritte Gründer, der Chief Technologist Kartikay Khandelwal, und die rund 14 übrigen Mitarbeiter von WaveForms zu Meta wechseln, ist noch unklar. Die Webseite von WaveForms ist bereits offline, während das LinkedIn-Profil weiterhin die Mission des Unternehmens beschreibt: die Überwindung des „Speech Turing Test“ – also die Erstellung von KI-Sprache, die von menschlicher Stimme nicht zu unterscheiden ist. Zudem arbeitete das Unternehmen an „Emotional General Intelligence“ (EGI), einem Ansatz, der darauf abzielt, KI in der Lage zu machen, menschliche Emotionen zu erkennen, zu verstehen und angemessen darauf zu reagieren. Ein zentrales technologisches Merkmal von WaveForms ist das sogenannte „end-to-end audio language model“, das alle Schritte der Sprachinteraktion – Spracherkennung, Textgenerierung und Sprachsynthese – in einem einzigen Modell vereint. Im Gegensatz zu herkömmlichen Systemen, die drei separate Modelle benötigen, ermöglicht dies eine flüssigere, natürlichere und emotionalere Interaktion. Diese Technologie könnte beispielsweise in einem AI-Teacher-System dazu beitragen, dass die KI die emotionale Verfassung eines Schülers erkennt – etwa Frust oder Unsicherheit – und entsprechend empathischer reagiert. Meta sieht in der Akquisition eine entscheidende Stärkung seiner KI-Strategie, insbesondere nachdem der geplante Llama-4-Modell-Release aufgrund von Schwächen in der Sprachinteraktion gegenüber OpenAI-Modellen verschoben wurde. Mit Conneau und Lemaitre, die nun direkt unter Johan Schalkwyk, dem neuen Leiter der Sprachtechnologie im Superintelligence Labs, arbeiten werden, erhält Meta Zugang zu einem führenden Team im Bereich emotionaler KI-Sprache. Der genaue Kaufpreis bleibt ungenannt, doch aufgrund der hohen Bewertung und des harten Wettbewerbs um Top-KI-Talente wird er vermutlich im mehrstelligen Millionenbereich liegen. Zukünftig könnte die Technologie von WaveForms Meta AI, Instagram Reels und die Entwicklung im Metaverse revolutionieren – etwa durch natürlichere Sprachübersetzungen, emotionale Avatar-Interaktionen oder immersive Kommunikation in virtuellen Welten. Mark Zuckerberg hatte bereits im April betont, dass jeder Nutzer eines Tages einen rund um die Uhr verfügbaren, menschenähnlichen AI-Partner haben werde. Die Übernahme von WaveForms ist ein klarer Schritt in diese Richtung.

Related Links