날짜

7달 전

태그

Video Captioning

다중모달

논문 URL

2504.16030

라이선스

Apache 2.0

GitHub

showlab/livecc

GPU 컴퓨팅 에어드롭

단 20시간의 RTX 5090 컴퓨팅 리소스 $1 (가치 $7)

지금 사용하기

프로젝트 개요

LiveCC는 싱가포르 국립대학교 쇼랩(Show Lab)과 바이트댄스(ByteDance)가 공동 개발하여 2025년 4월 25일에 처음 출시한 비디오 기반 대규모 언어 모델 프로젝트로, 대규모 스트리밍 음성 전사에 초점을 맞추고 있습니다. 이 프로젝트는 혁신적인 비디오 자동 음성 인식(ASR) 스트리밍 방식을 사용하여 실시간 주석 기능을 갖춘 최초의 비디오 기반 대규모 언어 모델을 학습시키고, 스트리밍 및 오프라인 벤치마크 모두에서 최첨단(SOTA) 성능을 달성하는 것을 목표로 합니다. 관련 연구 논문은 별도로 제공됩니다. LiveCC: 대규모 스트리밍 음성 전사를 통한 비디오 LLM 학습이는 CVPR 2025에 포함되었습니다.

이 튜토리얼에서는 리소스로 단일 RTX A6000 카드를 사용합니다.

프로젝트 예시

실행 단계

1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 웹 페이지에 접속하면 모델과 상호작용이 가능합니다.

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 1~2분 정도 기다리신 후 페이지를 새로고침해 주세요.

이 튜토리얼에서는 실시간 해설 모듈과 대화 모듈이라는 두 가지 모듈 테스트를 제공합니다.

리소스 혼잡을 피하려면 모델을 자주 전환하지 마세요.

각 모듈의 기능은 다음과 같습니다.

실시간 해설

🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@inproceedings{livecc,
    author       = {Joya Chen and Ziyun Zeng and Yiqi Lin and Wei Li and Zejun Ma and Mike Zheng Shou},
    title        = {LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale},
    booktitle    = {CVPR},
    year         = {2025},
}

이 노트북은 커뮤니티 사용자가 기여한 것으로 교육 및 정보 제공 목적으로만 사용됩니다. 저작권 침해와 관련된 콘텐츠가 있는 경우 [email protected]로 문의하시면 신속하게 검토 및 삭제 처리하겠습니다.

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

HyperAI

이 노트북 실행하기 Discord에서 논의하기

날짜

7달 전

태그

Video Captioning

다중모달

논문 URL

2504.16030

라이선스

Apache 2.0

GitHub

showlab/livecc

GPU 컴퓨팅 에어드롭

단 20시간의 RTX 5090 컴퓨팅 리소스 $1 (가치 $7)

지금 사용하기

프로젝트 개요

이 튜토리얼에서는 리소스로 단일 RTX A6000 카드를 사용합니다.

프로젝트 예시

실행 단계

1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 웹 페이지에 접속하면 모델과 상호작용이 가능합니다.

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 1~2분 정도 기다리신 후 페이지를 새로고침해 주세요.

이 튜토리얼에서는 실시간 해설 모듈과 대화 모듈이라는 두 가지 모듈 테스트를 제공합니다.

리소스 혼잡을 피하려면 모델을 자주 전환하지 마세요.

각 모듈의 기능은 다음과 같습니다.

실시간 해설

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@inproceedings{livecc,
    author       = {Joya Chen and Ziyun Zeng and Yiqi Lin and Wei Li and Zejun Ma and Mike Zheng Shou},
    title        = {LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale},
    booktitle    = {CVPR},
    year         = {2025},
}

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

HyperAI

이 노트북 실행하기 Discord에서 논의하기

날짜

7달 전

태그

Video Captioning

다중모달

논문 URL

2504.16030

라이선스

Apache 2.0

GitHub

showlab/livecc

GPU 컴퓨팅 에어드롭

단 20시간의 RTX 5090 컴퓨팅 리소스 $1 (가치 $7)

지금 사용하기

프로젝트 개요

이 튜토리얼에서는 리소스로 단일 RTX A6000 카드를 사용합니다.

프로젝트 예시

실행 단계

1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 웹 페이지에 접속하면 모델과 상호작용이 가능합니다.

"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 1~2분 정도 기다리신 후 페이지를 새로고침해 주세요.

이 튜토리얼에서는 실시간 해설 모듈과 대화 모듈이라는 두 가지 모듈 테스트를 제공합니다.

리소스 혼잡을 피하려면 모델을 자주 전환하지 마세요.

각 모듈의 기능은 다음과 같습니다.

실시간 해설

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@inproceedings{livecc,
    author       = {Joya Chen and Ziyun Zeng and Yiqi Lin and Wei Li and Zejun Ma and Mike Zheng Shou},
    title        = {LiveCC: Learning Video LLM with Streaming Speech Transcription at Scale},
    booktitle    = {CVPR},
    year         = {2025},
}

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩

바로 사용 가능한 GPU

최적의 가격

시작하기 가격 보기

HyperAI Newsletters

최신 정보 구독하기

한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다

이메일 서비스 제공: MailChimp

Command Palette

LiveCC: 실시간 영상 해설 대형 모델

GPU 컴퓨팅 에어드롭

프로젝트 개요

프로젝트 예시

실행 단계

인용 정보

AI로 AI 구축

HyperAI Newsletters

Command Palette

LiveCC: 실시간 영상 해설 대형 모델

GPU 컴퓨팅 에어드롭

프로젝트 개요

프로젝트 예시

실행 단계

인용 정보

AI로 AI 구축

HyperAI Newsletters

Command Palette

LiveCC: 실시간 영상 해설 대형 모델

GPU 컴퓨팅 에어드롭

프로젝트 개요

프로젝트 예시

실행 단계

인용 정보

AI로 AI 구축

HyperAI Newsletters