简介

Whisper 是 OpenAI 于 2023 年开源的语音转文本模型，其生成效果广受好评，该教程是基于 GitHub 上的开源项目 Whisper Web，直接在浏览器中运行使用 Whisper 。

Whisper 基于 ML 进行语音识别，并可通过 WebGPU 进行运行加速。支持 100 多种语言的线上/本地音频文件上传和即时录音，识别到的文本支持导出 TXT 和 JSON 两种文件格式，还可以直接翻译为英文。

效果展示

本笔记本由社区用户贡献,仅用于教育和信息传播目的。如果任何内容涉及版权侵权,请通过 [email protected] 联系我们,我们将及时审核并删除。

从创意到上线——通过免费 AI 协同编码、开箱即用的环境和最优惠的 GPU 价格,加速您的 AI 开发。

AI 协同编码

开箱即用的 GPU

最优定价

订阅我们的最新资讯

我们会在北京时间 每周一的上午九点 向您的邮箱投递本周内的最新更新

邮件发送服务由 MailChimp 提供

日期

2 年前

标签

Whisper 是 OpenAI 于 2023 年开源的语音转文本模型，其生成效果广受好评，该教程是基于 GitHub 上的开源项目 Whisper Web，直接在浏览器中运行使用 Whisper 。