Command Palette

Search for a command to run...

19일 전

노드 기반 편집을 통한 텍스트, 오디오, 이미지 및 영상의 다중모달 생성

Alexander Htet Kyaw Lenin Ravindranath Sivalingam

노드 기반 편집을 통한 텍스트, 오디오, 이미지 및 영상의 다중모달 생성

초록

다중모달 콘텐츠 생성을 위한 노드 기반 스토리텔링 시스템을 제안한다. 본 시스템은 사용자의 직접적인 편집과 자연어 프롬프트를 통해 확장, 편집, 반복적으로 개선할 수 있는 노드로 구성된 그래프 형태로 스토리를 표현한다. 각 노드는 텍스트, 이미지, 오디오, 비디오를 통합할 수 있어 창작자가 다중모달 내러티브를 구성할 수 있다. 작업 선택 에이전트는 스토리 생성, 노드 구조 추론, 노드 다이어그램 포맷팅, 맥락 생성 등 전문적인 생성 작업 간을 효율적으로 라우팅한다. 인터페이스는 개별 노드에 대한 타깃 편집, 병렬 스토리라인을 위한 자동 분기, 노드 기반의 반복적 개선을 지원한다. 실험 결과는 노드 기반 편집이 내러티브 구조에 대한 제어와 텍스트, 이미지, 오디오, 비디오의 반복 생성을 가능하게 함을 보여준다. 본 연구는 자동 스토리 개요 생성에 대한 정량적 결과와 편집 워크플로우에 대한 정성적 관찰을 보고한다. 마지막으로, 긴 스토리에 대한 확장성과 다수의 노드 간 일관성 유지 등 현재의 한계를 논의하며, 인간이 개입하는 방식과 사용자 중심의 창의적 AI 도구 개발을 위한 향후 연구 방향을 제시한다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 공동 코딩, 즉시 사용 가능한 환경, 최적 가격 GPU로 AI 개발을 가속화하세요.

AI 공동 코딩
즉시 사용 가능한 GPU
최적 가격
시작하기

Hyper Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp
노드 기반 편집을 통한 텍스트, 오디오, 이미지 및 영상의 다중모달 생성 | 연구 논문 | HyperAI초신경