3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

「Bad Gateway」と表示される場合は、モデルが初期化中です。モデルのサイズが大きいため、2～3分ほどお待ちいただき、ページを更新してください。Safariブラウザをご利用の場合、音声が直接再生されない場合がありますので、再生前にダウンロードしてください。

※このチュートリアルでは、「オーディオ入力モード」でシングルプレイヤーオーディオ生成（シングル）と2プレイヤーダイアログオーディオ生成（ロール）を選択できます。

HyperAI

このNotebookを実行 Discordで議論

日付

2ヶ月前

サイズ

8.4 MB

タグ

Text-to-Audio

ライセンス

Apache 2.0

GitHub

OpenMOSS/MOSS-TTSD

論文URL

www.open-moss.com

1. チュートリアルの概要

このチュートリアルでは、リソースとして単一の RTX 5090 カードを使用します。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

「Bad Gateway」と表示される場合は、モデルが初期化中です。モデルのサイズが大きいため、2～3分ほどお待ちいただき、ページを更新してください。Safariブラウザをご利用の場合、音声が直接再生されない場合がありますので、再生前にダウンロードしてください。

引用情報

このプロジェクトの引用情報は次のとおりです。

@article{moss2025ttsd,
  title={Text to Spoken Dialogue Generation}, 
  author={OpenMOSS Team},
  year={2025}
}

このノートブックはコミュニティユーザーによって提供されたものであり、教育および情報提供のみを目的としています。コンテンツに著作権侵害が含まれる場合は、[email protected]までご連絡ください。速やかに確認し、削除いたします。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

HyperAI

このNotebookを実行 Discordで議論

日付

2ヶ月前

サイズ

8.4 MB

タグ

Text-to-Audio

ライセンス

Apache 2.0

GitHub

OpenMOSS/MOSS-TTSD

論文URL

www.open-moss.com

1. チュートリアルの概要

このチュートリアルでは、リソースとして単一の RTX 5090 カードを使用します。

2. プロジェクト例

3. 操作手順

1. コンテナを起動した後、API アドレスをクリックして Web インターフェイスに入ります

2. 使用手順

「Bad Gateway」と表示される場合は、モデルが初期化中です。モデルのサイズが大きいため、2～3分ほどお待ちいただき、ページを更新してください。Safariブラウザをご利用の場合、音声が直接再生されない場合がありますので、再生前にダウンロードしてください。

引用情報

このプロジェクトの引用情報は次のとおりです。

@article{moss2025ttsd,
  title={Text to Spoken Dialogue Generation}, 
  author={OpenMOSS Team},
  year={2025}
}

Krea-realtime-video: リアルタイムビデオ生成モデル

3ヶ月前

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

2ヶ月前

ROCKET-2: 3Dゲームゼロショット転送

2ヶ月前

MAGE: モノクローナル抗体遺伝子ジェネレータ

2ヶ月前

Ministry-3-14B-Instructのワンクリック展開

2ヶ月前

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

2ヶ月前

OCRFlux-3B: インテリジェントテキスト認識ツールキット

3ヶ月前

JarvisArt-プレビュースマート写真レタッチプロキシ

1ヶ月前

kyutai-tts-1.6 b-en_fr オーディオ生成

1ヶ月前

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

Command Palette

MOSS: テキスト音声対話生成

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

引用情報

AIでAIを構築

HyperAI Newsletters

Command Palette

MOSS: テキスト音声対話生成

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

引用情報

関連 ノートブック

Krea-realtime-video: リアルタイムビデオ生成モデル

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

ROCKET-2: 3Dゲームゼロショット転送

MAGE: モノクローナル抗体遺伝子ジェネレータ

Ministry-3-14B-Instructのワンクリック展開

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

OCRFlux-3B: インテリジェントテキスト認識ツールキット

JarvisArt-プレビュー スマート写真レタッチプロキシ

kyutai-tts-1.6 b-en_fr オーディオ生成

AIでAIを構築

HyperAI Newsletters

Command Palette

MOSS: テキスト音声対話生成

1. チュートリアルの概要

2. プロジェクト例

3. 操作手順

引用情報

関連 ノートブック

Krea-realtime-video: リアルタイムビデオ生成モデル

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

ROCKET-2: 3Dゲームゼロショット転送

MAGE: モノクローナル抗体遺伝子ジェネレータ

Ministry-3-14B-Instructのワンクリック展開

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

OCRFlux-3B: インテリジェントテキスト認識ツールキット

JarvisArt-プレビュー スマート写真レタッチプロキシ

kyutai-tts-1.6 b-en_fr オーディオ生成

AIでAIを構築

HyperAI Newsletters

関連 ノートブック

Krea-realtime-video: リアルタイムビデオ生成モデル

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

ROCKET-2: 3Dゲームゼロショット転送

MAGE: モノクローナル抗体遺伝子ジェネレータ

Ministry-3-14B-Instructのワンクリック展開

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

OCRFlux-3B: インテリジェントテキスト認識ツールキット

JarvisArt-プレビュー スマート写真レタッチプロキシ

kyutai-tts-1.6 b-en_fr オーディオ生成

関連 ノートブック

Krea-realtime-video: リアルタイムビデオ生成モデル

F5-E2 TTS あらゆるサウンドをわずか 3 秒でクローン作成

ROCKET-2: 3Dゲームゼロショット転送

MAGE: モノクローナル抗体遺伝子ジェネレータ

Ministry-3-14B-Instructのワンクリック展開

LongCat-Image: バイリンガルテキスト駆動型画像生成システム

OCRFlux-3B: インテリジェントテキスト認識ツールキット

JarvisArt-プレビュー スマート写真レタッチプロキシ

kyutai-tts-1.6 b-en_fr オーディオ生成

関連ノートブック

JarvisArt-プレビュースマート写真レタッチプロキシ

関連ノートブック

JarvisArt-プレビュースマート写真レタッチプロキシ

関連ノートブック

JarvisArt-プレビュースマート写真レタッチプロキシ

関連ノートブック

JarvisArt-プレビュースマート写真レタッチプロキシ