HyperAIHyperAI

Command Palette

Search for a command to run...

Upgrade der OpenAI-Echtzeit-Sprach-API: GPT-5-Rationalität, Übersetzung in über 70 Sprachen und Echtzeit-Umschrift im Einsatz

OpenAI kündigte am Donnerstag an, dass seine Realtime-API um mehrere Funktionen für sprachliche Intelligenz erweitert wird, die Entwicklern dabei helfen sollen, Anwendungen zu erstellen, die hören, sprechen, übersetzen und transkribieren können. Zu den Kernprodukten gehören drei neue Modelle: Das auf der Inferenzleistung von GPT-5 basierende Modell GPT-Realtime-2 kann komplexere Benutzeranweisungen verarbeiten und natürlichere Sprachkonversationen ermöglichen; das Modell GPT-Realtime-Translate unterstützt Echtzeitübersetzungen mit über 70 Eingabe- und 13 Ausgabesprachen sowie einen sofortigen Wechsel während des Gesprächs; und das Modell GPT-Realtime-Whisper bietet eine Funktion zur Echtzeitschriftspracherkennung, bei der Transkripte parallel zum laufenden Dialog erstellt werden. Laut OpenAI treiben diese neuen Modelle die Entwicklung der Audio-Echtzeittechnologie voran – weg von einfachen „Frage-Antwort"-Interaktionen hin zu Sprachschnittstellen, die tatsächlich hören, schlussfolgern, übersetzen, transkribieren und Aktionen ausführen können. Die Zielbereiche umfassen Kundenservice, Bildung, Medienveranstaltungen sowie Plattformen für Kreatives. In Bezug auf potenzielle Missbrauchsrisiken erklärte OpenAI, dass Schutzmechanismen integriert wurden: Sobald im Verlauf eines Gesprächs Verstöße gegen Richtlinien für schädliche Inhalte erkannt werden, unterbricht das System automatisch. Hinsichtlich der Preisgestaltung werden Übersetzungs- und Transkriptfunktionen pro Minute abgerechnet, während GPT-Realtime-2 nach Verbrauch von Tokens berechnet wird; alle Optionen sind in die Realtime-API eingebunden.

Verwandte Links

Upgrade der OpenAI-Echtzeit-Sprach-API: GPT-5-Rationalität, Übersetzung in über 70 Sprachen und Echtzeit-Umschrift im Einsatz | Aktuelle Beiträge | HyperAI