HyperAIHyperAI

Command Palette

Search for a command to run...

Online-Spracherkennungstool Whisper Web

Einführung

Whisper ist ein Spracherkennungsmodell, das OpenAI 2023 als Open Source freigegeben hat. Sein Generierungseffekt wurde weithin gelobt. Dieses Tutorial basiert auf dem Open-Source-Projekt Whisper Web auf GitHub und führt Whisper direkt im Browser aus.

Whisper verwendet ML zur Spracherkennung und kann mit WebGPU beschleunigt werden. Es unterstützt das Online-/lokale Hochladen von Audiodateien und die sofortige Aufnahme in mehr als 100 Sprachen. Der erkannte Text kann in den Dateiformaten TXT und JSON exportiert und auch direkt ins Englische übersetzt werden.

Effektanzeige

Ausführungsmethode (nach dem Starten des Containers dauert die Initialisierung etwa 10 Sekunden, anschließend werden die folgenden Vorgänge ausgeführt)

1. Kopieren Sie nach dem Klonen und Starten des Containers die API in Ihren Browser

2. Erhalten Sie Audiodateien durch Online-/lokalen Upload oder sofortige Aufnahme

3. Wählen Sie das Modell entsprechend Ihren Anforderungen

4. Nach Abschluss der Modellauswahl direkt die Ergebnisse generieren

KI mit KI entwickeln

Von der Idee bis zum Start — beschleunigen Sie Ihre KI-Entwicklung mit kostenlosem KI-Co-Coding, sofort einsatzbereiter Umgebung und den besten GPU-Preisen.

KI-Co-Coding
Sofort einsatzbereit GPUs
Beste Preise
Jetzt starten

Hyper Newsletters

Abonnieren Sie unsere neuesten Updates
Wir werden die neuesten Updates der Woche in Ihren Posteingang liefern um neun Uhr jeden Montagmorgen
Unterstützt von MailChimp
Online-Spracherkennungstool Whisper Web | Tutorials | HyperAI