摘要

我们推出了 pyannote.audio，这是一个基于 Python 编写的开源工具包，专用于说话人分割（speaker diarization）。该工具包基于 PyTorch 机器学习框架，提供了一系列可训练的端到端神经模块，这些模块可灵活组合并联合优化，用于构建高效的说话人分割流水线。此外，pyannote.audio 配备了覆盖多种应用场景的预训练模型，涵盖语音活动检测（voice activity detection）、说话人切换检测（speaker change detection）、重叠语音检测（overlapped speech detection）以及说话人嵌入（speaker embedding）等任务，其在大多数任务上均达到了当前最优（state-of-the-art）的性能水平。

源 PDF

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

6 个月前

Hervé Bredin Ruiqing Yin Juan Manuel Coria Gregory Gelly Pavel Korshunov Marvin Lavechin Diego Fustes Hadrien Titeux Wassim Bouaziz Marie-Philippe Gill

摘要

我们推出了 pyannote.audio，这是一个基于 Python 编写的开源工具包，专用于说话人分割（speaker diarization）。该工具包基于 PyTorch 机器学习框架，提供了一系列可训练的端到端神经模块，这些模块可灵活组合并联合优化，用于构建高效的说话人分割流水线。此外，pyannote.audio 配备了覆盖多种应用场景的预训练模型，涵盖语音活动检测（voice activity detection）、说话人切换检测（speaker change detection）、重叠语音检测（overlapped speech detection）以及说话人嵌入（speaker embedding）等任务，其在大多数任务上均达到了当前最优（state-of-the-art）的性能水平。

源 PDF

用 AI 构建 AI

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

开始使用查看定价

HyperAI Newsletters

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

Command Palette

pyannote.audio：说话人分离的神经学构建模块

Hervé Bredin Ruiqing Yin Juan Manuel Coria Gregory Gelly Pavel Korshunov Marvin Lavechin Diego Fustes Hadrien Titeux Wassim Bouaziz Marie-Philippe Gill

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

pyannote.audio：说话人分离的神经学构建模块

Hervé Bredin Ruiqing Yin Juan Manuel Coria Gregory Gelly Pavel Korshunov Marvin Lavechin Diego Fustes Hadrien Titeux Wassim Bouaziz Marie-Philippe Gill

摘要

用 AI 构建 AI

HyperAI Newsletters

Command Palette

pyannote.audio：说话人分离的神经学构建模块

Hervé Bredin Ruiqing Yin Juan Manuel Coria Gregory Gelly Pavel Korshunov Marvin Lavechin Diego Fustes Hadrien Titeux Wassim Bouaziz Marie-Philippe Gill

摘要

用 AI 构建 AI

HyperAI Newsletters