3ヶ月前

マルチモーダル

マルチモーダル表現

人間-コンピュータインタラクション

マルチモーダル

Alexander Htet Kyaw Lenin Ravindranath Sivalingam

概要

本稿では、マルチモーダルなコンテンツ生成を目的としたノードベースの物語生成システムを提案する。本システムは、物語をノードのグラフとして表現し、ユーザーによる直接的な編集や自然言語プロンプトを通じて、ノードの拡張・編集・段階的改善が可能である。各ノードはテキスト、画像、音声、動画を統合でき、クリエイターがマルチモーダルな物語を構成できる。タスク選択エージェントが、物語生成、ノード構造の推論、ノード図のフォーマット、文脈生成といった専門的な生成タスクの間を適切にルーティングする。インターフェースは、個々のノードに対するターゲット編集、並行する物語線の自動分岐、ノードベースの段階的改善をサポートしている。実験結果から、ノードベースの編集が物語構造の制御およびテキスト・画像・音声・動画の段階的生成を可能にすることが示された。また、自動的な物語アウトライン生成に関する定量的評価と、編集ワークフローに関する定性的観察を報告する。最後に、長編物語へのスケーラビリティや複数ノード間の一貫性といった現時点での限界について議論し、人間を含むループ型（human-in-the-loop）かつユーザー中心のクリエイティブAIツールの今後の研究方向性を示す。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています

3ヶ月前

マルチモーダル

マルチモーダル表現

人間-コンピュータインタラクション

マルチモーダル

Alexander Htet Kyaw Lenin Ravindranath Sivalingam

概要

本稿では、マルチモーダルなコンテンツ生成を目的としたノードベースの物語生成システムを提案する。本システムは、物語をノードのグラフとして表現し、ユーザーによる直接的な編集や自然言語プロンプトを通じて、ノードの拡張・編集・段階的改善が可能である。各ノードはテキスト、画像、音声、動画を統合でき、クリエイターがマルチモーダルな物語を構成できる。タスク選択エージェントが、物語生成、ノード構造の推論、ノード図のフォーマット、文脈生成といった専門的な生成タスクの間を適切にルーティングする。インターフェースは、個々のノードに対するターゲット編集、並行する物語線の自動分岐、ノードベースの段階的改善をサポートしている。実験結果から、ノードベースの編集が物語構造の制御およびテキスト・画像・音声・動画の段階的生成を可能にすることが示された。また、自動的な物語アウトライン生成に関する定量的評価と、編集ワークフローに関する定性的観察を報告する。最後に、長編物語へのスケーラビリティや複数ノード間の一貫性といった現時点での限界について議論し、人間を含むループ型（human-in-the-loop）かつユーザー中心のクリエイティブAIツールの今後の研究方向性を示す。

AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助

すぐに使える GPU

最適な料金体系

開始する料金を見る

HyperAI Newsletters

最新情報を購読する

北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします

メール配信サービスは MailChimp によって提供されています