HyperAIHyperAI

Command Palette

Search for a command to run...

vLLM + Open WebUI를 사용하여 April-1.5-15b-Thinker 배포

날짜

5달 전

논문 URL

2510.01141

라이선스

MIT

GPU 컴퓨팅 에어드롭

단 20시간의 RTX 5090 컴퓨팅 리소스 $1 (가치 $7)
지금 사용하기

1. 튜토리얼 소개

Apriel-1.5-15b-Thinker는 ServiceNow에서 2025년 10월에 출시한 멀티모달 추론 모델입니다. 이 모델은 강화 학습이나 선호도 최적화를 사용하지 않으며, 처음부터 학습되지도 않습니다. 대신, 정교하게 설계된 "중간 학습" 프로세스를 통해 텍스트 및 시각적 작업 모두에서 최고 수준의 비공개 소스 모델과 견줄 만한 뛰어난 성능을 달성합니다. 150억 개의 파라미터만 가지고 있음에도 불구하고, 여러 권위 있는 벤치마크에서 10배 이상의 파라미터를 가진 주류 모델(예: Deepseek R1 0528 및 Gemini Flash)과 경쟁하는 성능을 보여주며, 매우 높은 추론 효율성과 포괄적인 기능을 입증합니다. 관련 논문의 제목은 "..."입니다.Apriel-1.5-15b-Thinker".

이 튜토리얼에서는 듀얼 카드 RTX 5090 설정을 사용합니다.

모델 함수

  • 텍스트 생성
  • 이미지 분석
  • 논리적 추론
  • 수학적 문제 해결
  • 코드 생성
  • 함수 호출
  • 다단계 작업 처리
  • 과학적 담론
  • 지식 관련 질문과 답변

2. 프로젝트 예시

3. 작업 단계

1. 컨테이너 시작 후 API 주소를 클릭하여 웹 인터페이스로 진입합니다.

2. 웹페이지에 접속 후 모델과 대화를 시작할 수 있습니다.

"모델"이 표시되지 않으면 모델이 초기화 중임을 의미합니다. 모델이 용량이 크므로 2~3분 정도 기다린 후 페이지를 새로고침해 주세요.

사용 방법

인용 정보

이 프로젝트에 대한 인용 정보는 다음과 같습니다.

@misc{radhakrishna2025apriel1515bthinker,
      title={Apriel-1.5-15b-Thinker}, 
      author={Shruthan Radhakrishna and Aman Tiwari and Aanjaneya Shukla and Masoud Hashemi and Rishabh Maheshwary and Shiva Krishna Reddy Malay and Jash Mehta and Pulkit Pattnaik and Saloni Mittal and Khalil Slimi and Kelechi Ogueji and Akintunde Oladipo and Soham Parikh and Oluwanifemi Bamgbose and Toby Liang and Ahmed Masry and Khyati Mahajan and Sai Rajeswar Mudumba and Vikas Yadav and Sathwik Tejaswi Madhusudhan and Torsten Scholak and Sagar Davasam and Srinivas Sunkara and Nicholas Chapados},
      year={2025},
      eprint={2510.01141},
      archivePrefix={arXiv},
      primaryClass={cs.AI},
      url={https://arxiv.org/abs/2510.01141}, 
}

AI로 AI 구축

아이디어에서 출시까지 — 무료 AI 코코딩, 즉시 사용 가능한 환경, 최적의 GPU 가격으로 AI 개발을 가속화하세요.

AI 협업 코딩
바로 사용 가능한 GPU
최적의 가격

HyperAI Newsletters

최신 정보 구독하기
한국 시간 매주 월요일 오전 9시 에 이번 주의 최신 업데이트를 메일로 발송합니다
이메일 서비스 제공: MailChimp