HyperAIHyperAI
Back to Headlines

OpenAI aktualisiert ChatGPT mit natürlicher Stimme

vor 3 Monaten

OpenAI hat das Advanced Voice-Feature von ChatGPT, das Benutzern ermöglicht, laut mündliche Dialoge mit dem KI-Assistenten zu führen, erheblich verbessert. Das Unternehmen kündigte über das Wochenende an, dass die Stimmen von ChatGPT nun natürlicher und flüssiger klingen, mit „feineren Intonationen“, „realistischerem Rhythmus“ (einschließlich Pausen und Betonungen) und mehr „präziser Expressivität“ für Emotionen wie Mitgefühl und Sarkasmus. Die neueste Version basiert auf dem im letzten Jahr eingeführten GPT-4 und nutzt ein multimodales Modell, das Audioeingaben schnell verarbeitet und innerhalb von durchschnittlich 320 Millisekunden antwortet – fast so schnell wie menschliche Konversationen. Bereits Anfang dieses Jahres hatte OpenAI kleinere Verbesserungen durchgeführt, um das Frequenz der Unterbrechungen und die Verarbeitung von Akzenten zu optimieren. Der aktuelle Update geht jedoch einen Schritt weiter und hebt die Qualität der Sprachantworten erheblich. Die Stimmen sind nun feiner moduliert und der Rhythmus natürlicher, insbesondere bei der Behandlung von Pausen und Betonungen. Zudem ist die KI in der Lage, Emotionen wie Mitgefühl und Sarkasmus präziser darzustellen, was den emotionalen Aspekt der Kommunikation zwischen Mensch und Maschine verbessert. Ein weiterer wichtiger Zugang der Aktualisierung ist die erweiterte Übersetzungsfunktion. Benutzer können ChatGPT einfach auffordern, eine Konversation zu übersetzen, und es wird dies tun, bis sie die Anweisung erhalten, aufzuhören oder zu einer anderen Sprache zu wechseln. Diese Funktion kann die Notwendigkeit von speziellen Sprachübersetzungsanwendungen reduzieren und die Benutzerfreundlichkeit erheblich steigern. Das aktualisierte Advanced Voice-Feature ist für alle bezahlenden ChatGPT-Benutzer weltweit verfügbar. Trotz der vielen Verbesserungen gibt OpenAI zu, dass es immer noch einige bekannte Einschränkungen gibt. In seltenen Fällen kann die Audioqualität leicht nachlassen, wobei es zu unerwarteten Variationen in Tonlage und Intonation kommen kann. Außerdem können in bestimmten Szenarien ungewollte Geräusche auftreten, wie zum Beispiel Werbung, Unsinn oder Hintergrundmusik. Das Unternehmen versichert, dass es weiter an der Verbesserung der Audioqualität arbeiten und diese Probleme schrittweise beheben wird. Diese Neuerungen sind besonders bedeutend, da sie die Barriere zwischen Menschen und KI-Assistenten weiter abbauen und eine nahtlosere Interaktion ermöglichen. Die verbesserte Spracherkennung und -synthese von ChatGPT könnte in Zukunft auch andere Anwendungen revolutionieren, wie z.B. Assistenzsysteme für Behinderte, Sprachassistenten im Fahrzeug und virtuelle Kundendienst-Mitarbeiter. Experten in der Branche loben die Fortschritte, die OpenAI gemacht hat, und sehen in ihnen einen wichtigen Schritt zur Weiterentwicklung der KI-gestützten Kommunikationstechnologien. Gleichzeitig betonen sie, dass es noch viel Potenzial gibt, um die natürliche Sprachverarbeitung und -generierung zu verbessern. OpenAI ist bekannt für seine führende Position in der Entwicklung von KI-Technologien und hat sich in den letzten Jahren durch innovative Produkte wie GPT-3 und GPT-4 einen Namen gemacht. Die Aktualisierung des Advanced Voice-Features zeigt, dass das Unternehmen nicht vorhat, in seiner Forschung und Entwicklung stillzustehen, sondern weiterhin daran arbeitet, die Grenzen der KI-Kommunikation zu erweitern.

Related Links

OpenAI aktualisiert ChatGPT mit natürlicher Stimme | Schlagzeilen | HyperAI