Google sichert sich Hume-AI-Team für Sprach-Intelligenz
Google DeepMind hat nach Berichten von Wired ein hochkarätiges Team aus dem KI-Startup Hume AI übernommen, ohne die Firma selbst zu kaufen. Im Rahmen einer Lizenzvereinbarung wird CEO Alan Cowen sowie etwa sieben weitere führende Ingenieure künftig bei DeepMind arbeiten, um die Sprachfunktionen von Gemini weiter zu verbessern. Die verbleibenden Aktivitäten von Hume AI sollen weiterhin ihre Technologie an andere KI-Unternehmen liefern, wobei die finanziellen Einzelheiten des Deals nicht offengelegt wurden. Google und Hume AI haben sich gegenüber TechCrunch zu dem Bericht noch nicht geäußert. Das besondere Know-how von Hume AI liegt in seiner Fähigkeit, Emotionen und Stimmungen anhand der Stimme eines Nutzers zu erkennen. 2024 stellte das Startup seine „Empathetic Voice Interface“ vor – eine conversational AI mit emotionaler Intelligenz. Bislang hat Hume AI rund 80 Millionen US-Dollar an Kapital aufgebracht und rechnet mit einem Umsatz von 100 Millionen Dollar in diesem Jahr. Die Übernahme stellt einen typischen „Acquihire“ dar: Ein etablierter Tech-Riese sichert sich talentierte Teams, um schnell in neue Bereiche einzusteigen, ohne regulatorische Hürden durch eine vollständige Unternehmensübernahme zu provozieren. Ähnliche Deals gab es zuletzt von Google mit dem KI-Coding-Startup Windsurf und von OpenAI mit Covogo und Roi. Die Federal Trade Commission (FTC) hat kürzlich angekündigt, solche Akquisitionen genauer zu überwachen. Der Schritt unterstreicht, dass Sprache zunehmend zum zentralen Interaktionsmodus in der KI-Entwicklung wird – besonders für tragbare Geräte. Google verbessert seit längerem seine Gemini Live-Funktion, die natürliche Gespräche mit dem Chatbot ermöglicht. Vor Kurzem veröffentlichte das Unternehmen ein neues Audio-Modell für die Live-API, das komplexe Arbeitsabläufe effizienter handhabt. Auch andere Tech-Riesen setzen auf Sprach-Intelligenz: OpenAI arbeitet an einer audiozentrierten persönlichen Hardware in Zusammenarbeit mit Jonny Ive und dem Unternehmen io, die vermutlich als Earbuds auf den Markt kommen könnte. Meta hat zudem das Startup Play AI übernommen und baut die Sprachfunktionen seiner Ray-Ban Smart Glasses weiter aus – etwa für verbesserte Spracherkennung in lauten Umgebungen und handsfreie Steuerung von Anrufen, Nachrichten und Medien. „Sprache ist der einzige akzeptable Eingabemodus für tragbare Geräte“, betont Investorin Vanessa Larco. Die Nachfrage nach Sprach-Technologien wächst rasant: Kurz vor dem Bericht erreichte das KI-Sprecher-Startup ElevenLabs einen jährlichen wiederkehrenden Umsatz von 330 Millionen Dollar. Die Übernahme von Hume AI zeigt, dass Sprach-KI nicht nur ein technologischer Trend, sondern ein strategisches Terrain ist, auf dem sich die großen Tech-Player gegenseitig abzuschneiden versuchen – mit direkten Auswirkungen auf die Zukunft von Interaktion, Wearables und personaler KI.
