Date

il y a 2 ans

Taille

48.38 GB

Organisation

URL de publication

www.aishelltech.com

Balises

Multimodal

Traitement Audio Et Vocal

PyTorch

Reconnaissance Vocale

Text-to-Speech

AISHELL-4 est un ensemble de données vocales en mandarin enregistrées à grande échelle et collectées par un réseau de microphones circulaires à 8 canaux pour le traitement de la parole dans les scénarios de conférence.**L'ensemble de données comprend 211 sessions de conférence enregistrées, chacune contenant de 4 à 8 intervenants, d'une durée totale de 120 heures.**Cet ensemble de données vise à combiner des recherches avancées et des scénarios d'application pratique du traitement multi-locuteurs sous trois aspects. En utilisant de véritables conférences enregistrées, AISHELL-4 fournit des effets acoustiques réalistes et des fonctionnalités vocales naturelles riches dans les conversations, telles que de courtes pauses, des chevauchements de discours, des tours de parole rapides, du bruit, etc. Dans le même temps, une transcription précise et une activité vocale de l'orateur sont fournies pour chaque réunion dans AISHELL. Cela permet aux chercheurs d'explorer différents aspects du traitement des conférences, depuis des tâches individuelles telles que le traitement frontal de la parole, la reconnaissance vocale et la diarisation des locuteurs, jusqu'à la modélisation multimodale et l'optimisation conjointe des tâches connexes. L’équipe de recherche a également publié un cadre de formation et d’évaluation basé sur PyTorch comme système de base pour promouvoir la recherche reproductible dans ce domaine.

AISHELL-4.torrent

Seeding 1Téléchargement 0Terminé 293Total Downloads 650

AISHELL-4/
- README.md
  1.68 KB
- README.txt
  3.36 KB

Ce jeu de données est fourni par les utilisateurs de la communauté et est destiné uniquement à des fins éducatives et informatives. Si un contenu enfreint des droits d'auteur, veuillez nous contacter à [email protected] pour examen et retrait rapides.

undefined

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

il y a 5 mois

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

il y a 5 mois

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

il y a 6 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

HyperAI

Utiliser ce jeu de données

Discuter sur Discord

Date

il y a 2 ans

Taille

48.38 GB

Organisation

URL de publication

www.aishelltech.com

Balises

Multimodal

Traitement Audio Et Vocal

PyTorch

Reconnaissance Vocale

Text-to-Speech

AISHELL-4.torrent

Seeding 1Téléchargement 0Terminé 293Total Downloads 650

AISHELL-4/
- README.md
  1.68 KB
- README.txt
  3.36 KB

undefined

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

il y a 5 mois

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

il y a 5 mois

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

il y a 6 mois

Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA

GPU prêts à l’emploi

Tarifs les plus avantageux

Commencer Voir les tarifs

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour

Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin

Propulsé par MailChimp

Command Palette

Base De Données De Discours De Conférence Multicanaux Chinois AISHELL-4

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Base De Données De Discours De Conférence Multicanaux Chinois AISHELL-4

undefined

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Créer de l'IA avec l'IA

HyperAI Newsletters

Command Palette

Base De Données De Discours De Conférence Multicanaux Chinois AISHELL-4

undefined

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

Créer de l'IA avec l'IA

HyperAI Newsletters

undefined

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG

undefined

Ensemble De Données d'évaluation Des Capacités De Planification À Long Terme De DeepPlanning

Ensemble De Données Vidéo De Synthèse De Réflexion Transparente TransPhy3D

Ensemble De Données De Photopléthysmographie À Distance Multicaméra MCD-rPPG