16일 전
플롯 및 리워크: 시각적 스토리텔링을 위한 스토리라인 모델링
Chi-Yang Hsu, Yun-Wei Chu, Ting-Hao ', Kenneth', Huang, Lun-Wei Ku

초록
일관성 있고 매력적인 이야기를 쓰는 것은 쉽지 않다. 창의적 작가들은 자신의 지식과 세계관을 바탕으로 산만한 요소들을 조합하여 일관성 있는 이야기 구조를 만들어내며, 완벽에 가까운 결과를 얻기 위해 반복적으로 작업하고 수정한다. 그러나 기존의 자동 시각 스토리텔링(VIST) 모델은 이야기를 생성할 때 외부 지식의 활용과 반복적인 생성 과정을 효과적으로 활용하지 못한다. 본 논문에서는 입력 이미지 시퀀스를 스토리 그래프로 표현하는 PR-VIST 프레임워크를 제안한다. 이 프레임워크는 그래프 내에서 최적의 경로를 탐색하여 이야기 흐름을 구성한다. 이후 PR-VIST는 해당 경로를 기반으로 반복적인 학습 과정을 통해 최종 스토리를 생성한다. 제안된 프레임워크는 자동 평가와 인간 평가를 통해 다양성, 일관성, 인간다움 측면에서 기존 모델보다 뛰어난 성능을 보였다. 제거 실험(Ablation study)을 통해 플롯팅(구성)과 재작업(리워크) 모두가 모델의 우수성에 기여함을 확인하였다.