このNotebookを実行 Discordで議論

日付

1年前

サイズ

386.62 MB

導入

Whisper は、2023 年に OpenAI によってオープンソース化された音声テキスト変換モデルです。このチュートリアルは、GitHub 上のオープンソースプロジェクト Whisper Web に基づいており、Whisper を使用してブラウザで直接実行されます。

Whisper は音声認識用の ML に基づいており、WebGPU によって高速化できます。オンライン/ローカルのオーディオファイルのアップロードと 100 以上の言語での即時録音をサポートし、認識されたテキストは TXT および JSON ファイル形式へのエクスポートをサポートし、英語に直接翻訳することもできます。

エフェクト表示

実行方法（コンテナ起動後、初期化に10秒程度かかり、その後以下の操作を行います）

1. コンテナを複製して起動した後、API をブラウザにコピーします

2. オンライン/ローカルアップロードまたはリアルタイム録音を通じてオーディオファイルを取得します

3. ニーズに基づいたモデルの選択

4. モデルの選択が完了したら、結果を直接生成します

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

このNotebookを実行 Discordで議論

日付

1年前

サイズ

386.62 MB

導入

Whisper は、2023 年に OpenAI によってオープンソース化された音声テキスト変換モデルです。このチュートリアルは、GitHub 上のオープンソースプロジェクト Whisper Web に基づいており、Whisper を使用してブラウザで直接実行されます。

Whisper は音声認識用の ML に基づいており、WebGPU によって高速化できます。オンライン/ローカルのオーディオファイルのアップロードと 100 以上の言語での即時録音をサポートし、認識されたテキストは TXT および JSON ファイル形式へのエクスポートをサポートし、英語に直接翻訳することもできます。

エフェクト表示

実行方法（コンテナ起動後、初期化に10秒程度かかり、その後以下の操作を行います）

1. コンテナを複製して起動した後、API をブラウザにコピーします

2. オンライン/ローカルアップロードまたはリアルタイム録音を通じてオーディオファイルを取得します

3. ニーズに基づいたモデルの選択

4. モデルの選択が完了したら、結果を直接生成します

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています