HyperAIHyperAI

Command Palette

Search for a command to run...

テキスト、音声、画像、動画のマルチモーダル生成のためのノードベース編集

Alexander Htet Kyaw Lenin Ravindranath Sivalingam

概要

本稿では、マルチモーダルなコンテンツ生成を目的としたノードベースの物語生成システムを提案する。本システムは、物語をノードのグラフとして表現し、ユーザーによる直接的な編集や自然言語プロンプトを通じて、ノードの拡張・編集・段階的改善が可能である。各ノードはテキスト、画像、音声、動画を統合でき、クリエイターがマルチモーダルな物語を構成できる。タスク選択エージェントが、物語生成、ノード構造の推論、ノード図のフォーマット、文脈生成といった専門的な生成タスクの間を適切にルーティングする。インターフェースは、個々のノードに対するターゲット編集、並行する物語線の自動分岐、ノードベースの段階的改善をサポートしている。実験結果から、ノードベースの編集が物語構造の制御およびテキスト・画像・音声・動画の段階的生成を可能にすることが示された。また、自動的な物語アウトライン生成に関する定量的評価と、編集ワークフローに関する定性的観察を報告する。最後に、長編物語へのスケーラビリティや複数ノード間の一貫性といった現時点での限界について議論し、人間を含むループ型(human-in-the-loop)かつユーザー中心のクリエイティブAIツールの今後の研究方向性を示す。


AIでAIを構築

アイデアからローンチまで — 無料のAIコーディング支援、すぐに使える環境、最高のGPU価格でAI開発を加速。

AI コーディング補助
すぐに使える GPU
最適な料金体系

HyperAI Newsletters

最新情報を購読する
北京時間 毎週月曜日の午前9時 に、その週の最新情報をメールでお届けします
メール配信サービスは MailChimp によって提供されています