Introduction

Whisper est un modèle de conversion de la parole en texte qu'OpenAI a ouvert en 2023. Son effet de génération a été largement salué. Ce tutoriel est basé sur le projet open source Whisper Web sur GitHub et exécute Whisper directement dans le navigateur.

Whisper utilise ML pour la reconnaissance vocale et peut être accéléré à l'aide de WebGPU. Il prend en charge le téléchargement de fichiers audio en ligne/local et l'enregistrement instantané dans plus de 100 langues. Le texte reconnu peut être exporté aux formats de fichiers TXT et JSON, et peut également être directement traduit en anglais.

Méthode d'exécution (il faut environ 10 secondes pour initialiser après le démarrage du conteneur, puis effectuer les opérations suivantes)

1. Après avoir cloné et démarré le conteneur, copiez l'API dans votre navigateur

2. Obtenez des fichiers audio par téléchargement en ligne/local ou par enregistrement instantané

3. Sélectionnez le modèle en fonction de vos besoins

4. Après avoir terminé la sélection du modèle, générez directement les résultats

HyperAI

Exécuter ce Notebook

Date

il y a un an

Taille

386.62 MB

Introduction

Affichage des effets

Méthode d'exécution (il faut environ 10 secondes pour initialiser après le démarrage du conteneur, puis effectuer les opérations suivantes)

1. Après avoir cloné et démarré le conteneur, copiez l'API dans votre navigateur

2. Obtenez des fichiers audio par téléchargement en ligne/local ou par enregistrement instantané

3. Sélectionnez le modèle en fonction de vos besoins

4. Après avoir terminé la sélection du modèle, générez directement les résultats

Ce notebook est fourni par des utilisateurs de la communauté et est destiné à des fins éducatives et informatives uniquement. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour un examen et un retrait rapides.

Associé Notebooks

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Exécuter ce Notebook

Date

il y a un an

Taille

386.62 MB

Introduction

Affichage des effets

Méthode d'exécution (il faut environ 10 secondes pour initialiser après le démarrage du conteneur, puis effectuer les opérations suivantes)

1. Après avoir cloné et démarré le conteneur, copiez l'API dans votre navigateur

2. Obtenez des fichiers audio par téléchargement en ligne/local ou par enregistrement instantané

3. Sélectionnez le modèle en fonction de vos besoins

4. Après avoir terminé la sélection du modèle, générez directement les résultats

Associé Notebooks

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

il y a 21 jours

GLM-ASR-Nano Reconnaissance Vocale Intelligente

il y a 2 mois

DiffVox : Modèle De Différenciation Sonore

il y a 3 mois

Doling : Outil d'analyse De Documents

il y a 2 mois

Sapin De Noël 3D Basé Sur La Reconnaissance Gestuelle

il y a 2 mois

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

il y a un mois

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

il y a 2 mois

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

il y a 2 mois

HunyuanWorld-1.0 : Un Modèle De Génération De Monde 3D

il y a 9 jours

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Outil De Reconnaissance Vocale En Ligne Whisper Web

Introduction

Affichage des effets

Méthode d'exécution (il faut environ 10 secondes pour initialiser après le démarrage du conteneur, puis effectuer les opérations suivantes)

1. Après avoir cloné et démarré le conteneur, copiez l'API dans votre navigateur

2. Obtenez des fichiers audio par téléchargement en ligne/local ou par enregistrement instantané

3. Sélectionnez le modèle en fonction de vos besoins

4. Après avoir terminé la sélection du modèle, générez directement les résultats

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Outil De Reconnaissance Vocale En Ligne Whisper Web

Introduction

Affichage des effets

Méthode d'exécution (il faut environ 10 secondes pour initialiser après le démarrage du conteneur, puis effectuer les opérations suivantes)

1. Après avoir cloné et démarré le conteneur, copiez l'API dans votre navigateur

2. Obtenez des fichiers audio par téléchargement en ligne/local ou par enregistrement instantané

3. Sélectionnez le modèle en fonction de vos besoins

4. Après avoir terminé la sélection du modèle, générez directement les résultats

Associé Notebooks

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

GLM-ASR-Nano Reconnaissance Vocale Intelligente

DiffVox : Modèle De Différenciation Sonore

Doling : Outil d'analyse De Documents

Sapin De Noël 3D Basé Sur La Reconnaissance Gestuelle

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

HunyuanWorld-1.0 : Un Modèle De Génération De Monde 3D

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Outil De Reconnaissance Vocale En Ligne Whisper Web

Introduction

Affichage des effets

Méthode d'exécution (il faut environ 10 secondes pour initialiser après le démarrage du conteneur, puis effectuer les opérations suivantes)

1. Après avoir cloné et démarré le conteneur, copiez l'API dans votre navigateur

2. Obtenez des fichiers audio par téléchargement en ligne/local ou par enregistrement instantané

3. Sélectionnez le modèle en fonction de vos besoins

4. Après avoir terminé la sélection du modèle, générez directement les résultats

Associé Notebooks

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

GLM-ASR-Nano Reconnaissance Vocale Intelligente

DiffVox : Modèle De Différenciation Sonore

Doling : Outil d'analyse De Documents

Sapin De Noël 3D Basé Sur La Reconnaissance Gestuelle

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

HunyuanWorld-1.0 : Un Modèle De Génération De Monde 3D

Créer de l'IA avec l'IA

HyperAI Newsletters

Associé Notebooks

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

GLM-ASR-Nano Reconnaissance Vocale Intelligente

DiffVox : Modèle De Différenciation Sonore

Doling : Outil d'analyse De Documents

Sapin De Noël 3D Basé Sur La Reconnaissance Gestuelle

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

HunyuanWorld-1.0 : Un Modèle De Génération De Monde 3D

Associé Notebooks

Fara-7B : Un Modèle D’agent Intelligent Web Hautement Efficace

GLM-ASR-Nano Reconnaissance Vocale Intelligente

DiffVox : Modèle De Différenciation Sonore

Doling : Outil d'analyse De Documents

Sapin De Noël 3D Basé Sur La Reconnaissance Gestuelle

JarvisArt - Aperçu Du Proxy De Retouche Photo Intelligent

Open-AutoGLM : Assistant Intelligent Pour Appareils Mobiles

Supertonic : Un Modèle De Synthèse Vocale TTS Haute Vitesse Basé Sur ONNX

HunyuanWorld-1.0 : Un Modèle De Génération De Monde 3D