HyperAI초신경
Back to Headlines

LTX-Video 13B 출시! 30배 빠른 고해상도 영상 생성

8일 전

LTX-Video 13B 출시! 30배 속도로 고해상도 비디오 생성, 오픈소스 AI로 창작의 경계를 넘어서! 인공지능 비디오 생성 기술이 새로운 전환점을 맞이했다! Lightricks가 자사의 LTX Studio를 통해 최신 오픈소스 비디오 생성 모델인 LTX-Video 13B를 출시하며 업계의 주목을 받고 있다. 이 모델은 130억 개의 파라미터, 동일한 모델보다 30배 빠른 생성 속도, 그리고 혁신적인 다중 스케일 렌더링 기술을 통해 높은 효율성을 제공한다. 이는 소비자용 GPU에서도 뛰어난 성능을 발휘하며, 비디오의 일관성과 세부 표현을 크게 향상시킨다. 기술 혁신: 다중 스케일 렌더링으로 비디오 생성 재정의 LTX-Video 13B는 독특한 다중 스케일 렌더링 기술을 사용하여 저해상도에서 비디오의 대략적인 움직임과 장면 레이아웃을 먼저 생성하고, 점진적으로 세부 사항을 보완하는 방식으로 작동한다. 이 기술 덕분에 모델은 고화질 출력을 유지하면서도 30배 더 빠른 생성 속도를 자랑하며, 5초짜리 비디오를 단 2초 만에 렌더링할 수 있다. 또한 NVIDIA RTX 4090 같은 소비자용 GPU에서도 부드럽게 실행되며, 메모리 요구량이 낮아 창작자가 더욱 효율적인 작업 환경을 경험할 수 있다. LTX-Video 13B는 DiT(Diffusion Transformer) 아키텍처를 기반으로 하며, 고급 커널 최적화와 bfloat16 데이터 형식을 결합하여 성능을 한층 더 끌어올렸다. 이 모델은 1216x704 해상도와 30프레임/초의 실시간 생성을 지원하며, 텍스트에서 비디오, 이미지에서 비디오, 비디오에서 비디오 등 다양한 생성 모드를 활용할 수 있어 다양한 창작 요구를 충족시킨다. 강력한 기능: 정밀한 제어와 무한한 창의성 LTX-Video 13B는 움직임의 일관성, 장면 구조, 카메라 움직임 이해력 등에서 뛰어난 성능을 보여준다. 모델은 키 프레임 제어, 캐릭터 및 카메라 움직임, 다중 장면 조합 등을 지원하여 사용자가 미세한 단위로 창작을 제어할 수 있게 한다. 예를 들어, 사용자는 텍스트 힌트나 참조 이미지를 통해 비디오 내의 캐릭터 움직임, 장면 전환, 또는 카메라 각도를 정확하게 조정할 수 있어 영화 같은 시각 효과를 만들어낼 수 있다. 또한, LTX-Video 13B는 비디오 연장 및 스타일/움직임 교체 기능을 제공하여, 기존 비디오를 최대 60초까지 연장하거나 실제 장면을 애니메이션 스타일로 변환하는 등의 작업을 쉽게 수행할 수 있다. 이러한 유연성으로 인해 이 모델은 단편 영화 제작, 광고 창의성, 소셜 미디어 콘텐츠 제작 등 다양한 분야에서 널리 활용될 가능성이 크다. 오픈소스 생태계: 개발자와 창작자에게 힘을 실어주다 LTX-Video 13B는 오픈소스 모델로서 GitHub와 Hugging Face에서 무료로 제공되며, 개발자와 창작자가 자유롭게 수정하고 맞춤화할 수 있다. Lightricks는 2B와 13B 모델의 전체 미세 조정(Fine-tuning) 및 LoRA(저랭크 적응) 훈련을 지원하는 LTX-Video-Trainer 도구를 제공하여, 사용자가 깊이, 포즈, 또는 에지 검출 등과 같은 맞춤형 제어 모델을 개발할 수 있도록 했다. 모델은 ComfyUI 워크플로와 호환되며, Looping Sampler 노드를 추가하여 임의 길이의 비디오를 생성할 수 있으며, 움직임 일관성을 유지하도록 설계되었다. Lightricks는 저메모리 디바이스에서의 성능을 최적화하기 위해 8비트 양자화 버전(ltxv-13b-fp8)과 IC-LoRA Detailer 등의 보조 도구를 출시하여 사용자 접근성을 더욱 높였다. LTX-Video 13B는 연간 매출 1000만 달러 미만의 기업과 조직에 무료로 개방되었으며, 이는 Lightricks가 AI의 민주화를 추구하는 의지를 보여준다. 현재 LTX-Video 13B는 LTX Studio 플랫폼에 통합되어 있으며, 공식 웹사이트(https://ltx.studio)나 GitHub(https://github.com/Lightricks/LTX-Video)에서 모델과 문서를 다운로드할 수 있다. Lightricks는 지속적으로 모델을 최적화하여 더 많은 제어 유형과 다중 모달 기능을 지원할 계획이다. 미래 전망: AI 비디오 창작의 새로운 장을 열다 Lightricks는 Getty Images와 같은 파트너로부터 제공받은 고품질 데이터셋을 통해 LTX-Video 13B를 개발했으며, 이는 출력 콘텐츠의 상업적 안전성과 시각적 매력을 보장한다. 향후, 팀은 시간 변화 힌트와 다중 모달 생성을 탐색하여 더 복잡한 창작 요구를 지원할 계획이다. AIbase는 LTX-Video 13B가 오픈소스 커뮤니티의 지원 하에 AI 비디오 생성 분야의 새로운 기준이 될 것으로 기대하고 있다. LTX-Video 13B의 출시는 오픈소스 비디오 생성 기술이 새로운 차원으로 진화했다는 것을 의미한다. 다중 스케일 렌더링 기술과 소비자용 하드웨어의 최적화는 고성능 장비 없이도 프로페셔널급 창작 도구를 사용할 수 있는 길을 열었다. 이로써 중소 규모 팀과 개인 창작자들이 영상, 게임, 광고, 교육 등 다양한 분야에서 더 혁신적인 비디오 생성 기술을 활용할 수 있게 되었다. Lightricks는 AI 비디오 생성 기술의 발전을 선도하는 기업으로 알려져 있으며, LTX-Video 13B는 이들의 기술 혁신 의지를 잘 보여주는 사례다. 이 모델이 오픈소스 생태계에서 어떻게 성장하고 혁신을 이끌어낼지 귀추가 주목된다.

Related Links