HyperAI초신경

CogVLM2-Llama3-Chinese-Chat-19B를 온라인으로 실행하세요

모델 소개

이전 세대 CogVLM 오픈 소스 모델과 비교했을 때, CogVLM2 시리즈 오픈 소스 모델은 다음과 같은 개선 사항이 있습니다.

  • TextVQA, DocVQA 등 많은 벤치마크에서 상당한 개선이 이루어졌습니다.
  • 8K 콘텐츠 길이를 지원합니다.
  • 최대 1344*1344의 이미지 해상도를 지원합니다.
  • 중국어와 영어를 지원하는 오픈소스 모델 버전이 제공됩니다.

실행 방법

  1. 새로운 터미널 페이지를 엽니다
  2. 명령을 입력하세요
cd CogVLM2/basic_demo
chainlit run web_demo.py --port 8080

프로그램을 실행하세요

  1. 오른쪽의 API 주소를 복사하여 브라우저에서 열어보세요. 
  2. 아래를 클릭하여 사진을 업로드하고 텍스트 프롬프트를 입력하세요.
  1. Enter를 눌러 답변을 생성하세요