CogVLM2-Llama3-Chinese-Chat-19B를 온라인으로 실행하세요
모델 소개
이전 세대 CogVLM 오픈 소스 모델과 비교했을 때, CogVLM2 시리즈 오픈 소스 모델은 다음과 같은 개선 사항이 있습니다.
- TextVQA, DocVQA 등 많은 벤치마크에서 상당한 개선이 이루어졌습니다.
- 8K 콘텐츠 길이를 지원합니다.
- 최대 1344*1344의 이미지 해상도를 지원합니다.
- 중국어와 영어를 지원하는 오픈소스 모델 버전이 제공됩니다.
실행 방법
- 새로운 터미널 페이지를 엽니다
- 명령을 입력하세요
cd CogVLM2/basic_demo
chainlit run web_demo.py --port 8080
프로그램을 실행하세요
- 오른쪽의 API 주소를 복사하여 브라우저에서 열어보세요.
- 아래를 클릭하여 사진을 업로드하고 텍스트 프롬프트를 입력하세요.

- Enter를 눌러 답변을 생성하세요
