HyperAI초신경

MIT와 Adobe가 협력해 개발한 AI 비디오 생성 도구 CausVid는 Sora와 같은 기존 모델들에 필적하는 품질을 자랑하며 실시간 수정이 가능하다. 이 도구는 고화질 비디오를 단 10초 만에 생성하는 능력을 보여주어, 동영상 제작 시간의 획기적인 단축을 예고한다. CausVid는 'OpenSORA'와 'MovieGen' 등의 기존 모델보다 생성 속도가 100배 빠르다. 이를 통해 가장 안정적이고 최상의 품질을 유지하면서도 긴 비디오 클립을 생성할 수 있다. 연구팀은 CausVid의 성능을 검증하기 위해 30초 길이의 비디오 생성을 시험했으며, 화질과 일관성 면에서 기대를 충족시켰다. 이 결과는 CausVid가 몇 분에서 몇 시간까지의 안정적인 비디오 생성을 실현할 수 있다는 것을 명확히 보여준다. 특히, 사용자 조사에서는 CausVid가 900번 이상의 텍스트-비디오 데이터 세트에서 84.27의 종합 평점을 받았다. 이 점수는 'Vchitect'와 'Gen-3' 등 다른 첨단 비디오 생성 모델을 크게 앞섰다. CausVid의 화질과 인간 행동 모방 능력은 특히 뛰어났다. CausVid의 개발자 Tianwei Yin은 "재귀 모델의 속도는 결정성을 의미한다"며 "비록 생성 시간이 짧지만, 다양한 시각적 다양성을 유지하는 것이 어렵다"라고 설명했다. 그러나 특정 도메인 데이터 집합으로 학습하면, CausVid는 더욱 향상된 비디오 콘텐츠를 생성할 수 있을 것으로 전망된다. 특히, 이 모델은 실시간 비디오 생성을 가능하게 하는 데 중점을 두고 개발되었다. 전문가들은 이러한 하이브리드 시스템이 확장 모델의 처리 속도 문제를 해결하는 중요한 업그레이드라고 평가한다. 카네기멜론대학교의 컴퓨터 과학 및 공학 조교수 Jun Yan Zhu는 "현재의 비디오 모델은 대형 언어 모델이나 이미지 생성 모델에 비해 속도가 느리다"면서 "이 연구는 효율성을 크게 높여, 더 빠른 스트리밍 속도, 더 강력한 상호 작용 응용 프로그램, 그리고 더 낮은 전력 소비를 가능하게 한다"라고 평가했다. 이 연구는 암스테르담 대학, 광저우 과학기술원, Adobe, Google, 미국 공군 연구소, 미국 공군 인공지능 가속기의 지원을 받아 수행되었으며, CausVid 기술은 6월에 열리는 국제 컴퓨터 비전 및 패턴 인식 회의(CVPR)에서 공식 발표될 예정이다. CausVid는 AI 비디오 생성 분야에서 새로운 기준을 제시하고 있다. 이 모델은 기존의 확장 기술을 활용하면서도, 속도와 품질 모두에서 뛰어난 성능을 보여주어, 미래의 비디오 제작 방식을 크게 변화시킬 가능성이 있다. 또한, 실시간 비디오 생성 능력은 다양한 산업에서 즉각적인 콘텐츠 제작과 편집을 가능하게 하여, 사용자 경험을 더욱 향상시킬 것으로 기대된다. 산업 전문가들은 CausVid의 출시가 비디오 제작 및 편집 산업에 큰 영향을 미칠 것이라고 전망한다. 이 모델은 기존의 비디오 생성 도구들보다 빠르고 안정적인 비디오 생성을 제공하여, 콘텐츠 생성자의 작업 효율을 크게 높일 것으로 보인다. 특히, 실시간 생성 기능은 라이브 스트리밍, 게임, 교육 등 다양한 분야에서 활용될 수 있어, 앞으로의 가능성이 무궁무진하다.

MIT와 Adobe, AI 비디오 생성 도구 개발... Sora 못지 않은 품질

Related Links