HyperAIHyperAI

Command Palette

Search for a command to run...

pyannote.audio : blocs fonctionnels neuronaux pour la diarisation des locuteurs

Hervé Bredin Ruiqing Yin Juan Manuel Coria Gregory Gelly Pavel Korshunov Marvin Lavechin Diego Fustes Hadrien Titeux Wassim Bouaziz Marie-Philippe Gill

Résumé

Nous présentons pyannote.audio, un outil open source écrit en Python dédié à la diarisation des locuteurs. Basé sur le cadre d'apprentissage automatique PyTorch, il offre une série de composants neuronaux entraînables en bout à bout, pouvant être combinés et optimisés conjointement afin de construire des chaînes de traitement de diarisation des locuteurs. pyannote.audio inclut également des modèles pré-entraînés couvrant un large éventail de domaines pour la détection d'activité vocale, la détection des changements de locuteur, la détection des interactions vocales superposées et les embeddings de locuteurs, atteignant des performances de pointe pour la plupart de ces tâches.


Créer de l'IA avec l'IA

De l'idée au lancement — accélérez votre développement IA avec le co-codage IA gratuit, un environnement prêt à l'emploi et le meilleur prix pour les GPU.

Codage assisté par IA
GPU prêts à l’emploi
Tarifs les plus avantageux

HyperAI Newsletters

Abonnez-vous à nos dernières mises à jour
Nous vous enverrons les dernières mises à jour de la semaine dans votre boîte de réception à neuf heures chaque lundi matin
Propulsé par MailChimp