원클릭 배포 GLM-4.1V-9B-Thinking
1. 튜토리얼 소개

GLM-4.1V-9B-Thinking은 Zhipu AI와 칭화대학교 팀이 2025년 7월 2일에 공개한 오픈 소스 시각 언어 모델입니다. 복잡한 인지 과제를 위해 설계되었으며 이미지, 비디오, 문서와 같은 다중 모드 입력을 지원합니다. GLM-4-9B-0414 기반 모델을 기반으로 하는 GLM-4.1V-9B-Thinking은 사고 패러다임을 도입하고 커리큘럼 샘플링 강화 학습(RLCS, Reinforcement Learning with Curriculum Sampling)을 통해 모델 성능을 포괄적으로 향상시켜 10B 매개변수 수준에서 시각 언어 모델 중 가장 강력한 성능을 달성했습니다. 이는 18개 목록 과제에서 8배 더 많은 매개변수를 사용한 Qwen-2.5-VL-72B와 동등하거나 그 이상입니다. 관련 논문 결과는 다음과 같습니다.GLM-4.1V-Thinking: 확장 가능한 강화 학습을 통한 다재다능한 다중 모드 추론을 향해".
이 튜토리얼의 컴퓨팅 리소스는 RTX A6000 카드 하나를 사용합니다. 이 튜토리얼은 텍스트 대화, 사진, 비디오, PDF 및 PPT 이해를 지원합니다.
2. 효과 표시
텍스트 대화

이미지 이해

비디오 이해

PDF 이해

PPT 이해

3. 작업 단계
1. 컨테이너를 시작하세요

2. 사용 단계
"잘못된 게이트웨이"가 표시되면 모델이 초기화 중임을 의미합니다. 모델이 크기 때문에 약 2~3분 정도 기다리신 후 페이지를 새로고침해 주시기 바랍니다.
업로드된 영상은 10초를 넘지 않아야 하며, PDF와 PPT는 10페이지를 넘지 않아야 합니다. 대화 중에는 영상과 사진이 동시에 존재할 수 없습니다. 각 대화가 끝날 때마다 해당 작업을 삭제하는 것이 좋습니다.

4. 토론
🖌️ 고품질 프로젝트를 발견하시면, 백그라운드에 메시지를 남겨 추천해주세요! 또한, 튜토리얼 교환 그룹도 만들었습니다. 친구들의 QR코드 스캔과 [SD 튜토리얼] 댓글을 통해 그룹에 가입하여 다양한 기술 이슈에 대해 논의하고 신청 결과를 공유해 주시기 바랍니다.↓

인용 정보
이 프로젝트에 대한 인용 정보는 다음과 같습니다.
@misc{glmvteam2025glm41vthinkingversatilemultimodalreasoning,
title={GLM-4.1V-Thinking: Towards Versatile Multimodal Reasoning with Scalable Reinforcement Learning},
author={GLM-V Team and Wenyi Hong and Wenmeng Yu and Xiaotao Gu and Guo Wang and Guobing Gan and Haomiao Tang and Jiale Cheng and Ji Qi and Junhui Ji and Lihang Pan and Shuaiqi Duan and Weihan Wang and Yan Wang and Yean Cheng and Zehai He and Zhe Su and Zhen Yang and Ziyang Pan and Aohan Zeng and Baoxu Wang and Boyan Shi and Changyu Pang and Chenhui Zhang and Da Yin and Fan Yang and Guoqing Chen and Jiazheng Xu and Jiali Chen and Jing Chen and Jinhao Chen and Jinghao Lin and Jinjiang Wang and Junjie Chen and Leqi Lei and Letian Gong and Leyi Pan and Mingzhi Zhang and Qinkai Zheng and Sheng Yang and Shi Zhong and Shiyu Huang and Shuyuan Zhao and Siyan Xue and Shangqin Tu and Shengbiao Meng and Tianshu Zhang and Tianwei Luo and Tianxiang Hao and Wenkai Li and Wei Jia and Xin Lyu and Xuancheng Huang and Yanling Wang and Yadong Xue and Yanfeng Wang and Yifan An and Yifan Du and Yiming Shi and Yiheng Huang and Yilin Niu and Yuan Wang and Yuanchang Yue and Yuchen Li and Yutao Zhang and Yuxuan Zhang and Zhanxiao Du and Zhenyu Hou and Zhao Xue and Zhengxiao Du and Zihan Wang and Peng Zhang and Debing Liu and Bin Xu and Juanzi Li and Minlie Huang and Yuxiao Dong and Jie Tang},
year={2025},
eprint={2507.01006},
archivePrefix={arXiv},
primaryClass={cs.CV},
url={https://arxiv.org/abs/2507.01006},
}