HyperAIHyperAI

Command Palette

Search for a command to run...

Howl:展開済みかつオープンソースのウェイクワード検出システム

Raphael Tang Jaejun Lee Afsaneh Razi Julia Cambre Ian Bicking Jofish Kaye Jimmy Lin

概要

本稿では、Mozilla Common VoiceやGoogle Speech Commandsといったオープンな音声データセットをネイティブにサポートする、オープンソースのウェイクワード検出ツールキット「Howl」について述べる。我々は、Speech CommandsおよびMCV(Mozilla Common Voice)から構築した自らの無料で利用可能なウェイクワード検出データセットを用いたベンチマーク結果を報告する。また、Firefoxウェブブラウザにおける音声インタラクティビティを可能にするプラグイン「Firefox Voice」へのシステム導入を実現している。Howlは、現時点で知られている限り、ウェブブラウザへのデプロイを対象としており、完全にプロダクション環境で運用可能なオープンソースのウェイクワード検出ツールキットとして初めての事例である。コードベースは以下のGitHubリポジトリで公開されている:https://github.com/castorini/howl


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています
Howl:展開済みかつオープンソースのウェイクワード検出システム | 記事 | HyperAI超神経