Back to Headlines

AI精准预测下一个镜头!南洋理工等团队推出Cut2Next框架,实现电影级叙事连贯的多镜头视频生成

5일 전

싱가포르 남양理工大学, 홍콩중문대, 상하이인공지능연구소 공동 연구팀이 영화 수준의 다중 장면 연속성과 시각 일관성을 갖춘 영상 생성 기술 'Cut2Next'를 개발했다. 이 기술은 '다음 장면 예측'(NSG)을 핵심으로, 계층적 다중 프롬프트 전략과 상황 인식 조건 주입(CACI), 계층적 주의 마스크(HAM)를 도입해, 감정 흐름, 촬영 각도, 조명, 캐릭터 일관성 등 다층적 요소를 동시에 고려한다. 기존 모델이 단일 장면 생성에 그친 반면, Cut2Next는 정반대, 정면, 전환 등 영화 편집 패턴을 자연스럽게 재현하며, 시각적 일관성과 서사 흐름을 동시에 확보한다. 연구팀은 이를 위해 20만 개 이상의 장면을 포함한 대규모 'RawCuts'와 정교한 감성 평가를 위한 'CuratedCuts' 데이터셋을 구축했으며, 기존 문장-이미지 모델보다 훨씬 뛰어난 성능을 입증했다. 이는 AIGC 짧은 드라마, 스토리보드 제작, 인터랙티브 게임, 로봇의 실내 환경 이해를 위한 시뮬레이션 데이터 생성 등에 응용 가능하다. 연구팀은 모델과 데이터를 오픈소스화할 계획이며, 산업계와 협업해 실제 제작 환경에 맞게 성능을 최적화할 예정이다. 이 연구는 AI가 단순한 정보 처리를 넘어 인간의 창작 언어인 '장면 언어'를 이해하고 재현할 수 있음을 보여주며, 다모달 AGI 구현에 중요한 단계로 평가된다.

Related Links