추론 속도가 1.7배 빨라졌습니다. vLLM V1 버전이 출시되었습니다! 최초의 다중 모드 단계별 추론 벤치마크 VRC-Bench가 4k개 이상의 주석 단계를 통해 출시되었습니다.

지난달, 대규모 모델 추론에 대한 수요가 급증함에 따라 AI 대규모 모델 추론 프레임워크 vLLM이 공식적으로 버전 v1.0을 출시했습니다. 이전 버전과 비교했을 때 컴퓨팅 효율성이 크게 최적화되었고, API 설계가 더욱 안정화되었으며, 하드웨어 잠재력이 최대한 발휘되었고, 추론 속도가 1.7배 빨라졌습니다! 수십억 개의 매개변수를 가진 모델의 효율적인 배포에 대한 강력한 지원을 제공합니다.
현재,vLLM 소개 튜토리얼이 hyper.ai 공식 웹사이트에 출시되었습니다. 설치부터 운영까지 안내해 드리며, vLLM을 빠르게 마스터할 수 있습니다!
vLLM 시작하기 튜토리얼:https://go.hyper.ai/qHl62
더 많은 vLLM 중국어 문서와 튜토리얼을 보려면 →를 방문하세요. https://vllm.hyper.ai
2월 5일부터 2월 14일까지 hyper.ai 공식 웹사이트가 업데이트됩니다.
* 고품질 공개 데이터 세트: 10
* 고품질 튜토리얼 선택: 6개
* 커뮤니티 게시물 선정: 5개 게시물
* 인기 백과사전 항목: 5개
* 2월 마감일 상위 컨퍼런스: 3
공식 웹사이트를 방문하세요:하이퍼.AI
선택된 공개 데이터 세트
1. VRC-Bench 시각적 추론 벤치마크 데이터 세트
이 데이터 세트는 시각적 추론, 수학적 및 논리적 추론, 과학적 추론, 문화적 및 사회적 이해 등 8개 분야의 과제를 포괄합니다. 여기에는 수동으로 검증된 4,000개 이상의 추론 단계가 포함되어 있어 다단계 추론에서 모델의 정확성과 논리적 일관성을 종합적으로 평가할 수 있습니다.
직접 사용:https://go.hyper.ai/AV43N

Terra는 전 세계를 포괄하는 다중 모드 시공간 데이터 세트로, 전 세계적으로 45년간의 시공간 데이터를 제공하며 648만 개의 고해상도 격자점을 포함하고 있으며, 시공간 데이터 마이닝 분야의 미래 연구를 촉진하고 보다 광범위한 시공간 지능의 실현을 촉진하는 것을 목표로 합니다.
직접 사용:https://go.hyper.ai/9eev3

이 데이터 세트에는 11,000개의 주요 장면이 포함되어 있으며, 이는 1,000개의 프리플롭 장면과 10,000개의 포스트플롭 장면으로 나뉘며, 광범위한 게임 상황을 포괄하며 복잡하고 전략적인 포커 게임에서 대규모 언어 모델(LLM)의 성능을 평가하도록 설계되었습니다.
직접 사용:https://go.hyper.ai/HK73H

4. 중국 도시 관광 명소 세부 정보 중국 도시 관광 명소 정보 데이터 세트
이 데이터 세트에는 중국 352개 도시의 관광 명소 데이터가 포함되어 있습니다. 각 도시의 csv 파일에는 100개의 위치가 포함되어 있습니다. 해당 데이터에는 위치 이름, 웹사이트, 주소, 명소 소개, 영업 시간, 이미지 URL, 평점, 권장 방문 기간, 권장 방문 시즌, 티켓 정보, 팁 및 기타 정보가 포함됩니다.
직접 사용:https://go.hyper.ai/uZ5Wh
이 데이터 세트는 미리 정의된 무작위 액션 시퀀스를 실행하여 70시간 분량의 게임 비디오를 수집하고 주석을 달았습니다. 이 데이터 세트는 3가지 생물군(숲, 평야, 사막), 3가지 기상 조건(맑음, 비, 뇌우), 6가지 시간대(예: 일출, 정오, 자정)로 미리 구성되어 2,000개 이상의 비디오 클립을 생성합니다.
직접 사용:https://go.hyper.ai/25DAe
이 데이터 세트는 대규모 모델을 위한 국가적 문화 미세 조정 데이터 세트로, 건축, 의복, 공예, 음식, 예절, 언어, 관습 등 7개 주요 분야를 포괄하는 151,159개의 데이터 항목을 포함하고 있습니다.
직접 사용:https://go.hyper.ai/Vd6ZP
7. AceMath Instruct 훈련 데이터 수학적 추론 데이터 세트
이 데이터 세트는 NVIDIA가 2025년에 AceMath 모델을 훈련하기 위해 공개한 데이터 세트로, 수학적 추론 과제에서 모델의 성능을 개선하는 것을 목표로 합니다.
직접 사용:https://go.hyper.ai/pT5Tr
8. ComplexFuncBench 복합 함수 호출 평가 데이터 세트
이 데이터 세트는 600개의 단일 도메인 샘플, 호텔, 항공편, 렌터카, 관광 명소 각각 150개, 크로스 도메인 샘플 400개를 포함하여 5가지 실제 시나리오에서 1,000개의 복잡한 함수 호출 샘플을 다룹니다. 택시 도메인은 기능이 2개뿐이므로 여러 도메인에서만 사용됩니다.
직접 사용:https://go.hyper.ai/v0p4c
데이터 세트에는 1,225개의 선별된 계획 의도와 참조 계획이 포함되어 있습니다. 이 데이터 세트는 여행 계획의 맥락에서 설정되었으며, 교통, 일일 식사, 명소, 숙박 등을 포함하는 주어진 쿼리를 기반으로 포괄적인 여행 계획을 생성하는 언어 에이전트가 필요합니다.
직접 사용:https://go.hyper.ai/22AhZ
이 데이터 세트에는 수백 가지 무기 화합물의 실험적 수용성 데이터가 포함되어 있습니다. 해당 데이터는 다양한 참고문헌에서 추출되었으며 재료정보학 분야에 적합합니다. 모든 용해도 데이터는 물 100g당 용질의 그램 단위로 표시됩니다.
직접 사용:https://go.hyper.ai/dqL1y
선택된 공개 튜토리얼
1. vLLM 시작하기 튜토리얼: 초보자를 위한 단계별 가이드
vLLM은 대규모 언어 모델의 추론을 가속화하기 위해 특별히 설계된 프레임워크입니다. 뛰어난 추론 효율성과 자원 최적화 능력으로 인해 전 세계적으로 폭넓은 주목을 받고 있습니다. 연구진은 고처리량 분산 LLM 서비스 엔진 vLLM을 구축하여 KV 캐시 메모리 낭비를 거의 없애고, 대규모 언어 모델 추론에서 발생하는 메모리 관리 병목 현상을 해결했습니다.
이 튜토리얼에서는 vLLM을 구성하고 실행하는 방법을 단계별로 보여주고, 설치부터 시작까지 완벽한 시작 가이드를 제공합니다. 아래 링크를 클릭하고 튜토리얼을 따라 vLLM을 배포하세요.
온라인으로 실행:https://go.hyper.ai/qHl62

Qwen2.5-Coder는 강력한 코드 생성 기능을 갖춘 인공지능 도우미입니다. 명확한 논리와 표준화된 구문으로 코드 출력을 지원하고, 사용자가 다양한 시각적 프로젝트를 빠르게 빌드하고 구현하는 데 도움이 되는 아티팩트 기능을 제공합니다. 미니 게임 개발 측면에서 Qwen2.5-Coder는 게임 규칙, 그래픽 스타일, 사용자 경험 요구 사항에 따라 게임 코드를 생성할 수 있습니다. 개발자는 이를 기반으로 사용자 정의 및 최적화하여 자체 게임을 빠르게 출시할 수 있습니다.
이 프로젝트는 Gradio 인터페이스를 통해 프런트엔드 대화형 인터페이스를 생성할 수 있습니다. 관련 모델과 종속성이 배포되었습니다. 모델에 지침을 입력하고 한 번의 클릭으로 필요한 코드를 생성할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/JVOTN

3. GLM-4-Voice 종단간 중국어-영어 대화 모델
GLM-4-Voice는 중국어와 영어 음성을 직접 이해하고 생성하고, 실시간 음성 대화를 진행하며, 사용자 지시에 따라 감정, 억양, 말하는 속도, 방언 등의 음성 속성을 변경할 수 있는 종단 간 음성 모델입니다.
공식 웹사이트로 가서 컨테이너를 복제하고 시작하고, API 주소를 직접 복사하면 모델과 통신할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/s4MId

4. 린리-더빙 원클릭 영상 다운로드 + 번역 + 더빙 + 자막
린리더빙은 영상 콘텐츠를 여러 언어로 자동 번역하고 자막을 생성할 수 있는 지능형 영상 다국어 AI 더빙 및 번역 도구입니다.
아래 링크를 클릭하여 지금 바로 창의적인 여정을 시작하고 다국어 AI 더빙 및 비디오 번역을 실현해보세요.
온라인으로 실행:https://go.hyper.ai/xEAzn

5. DrawingSpinUp: 2D 캐릭터 드로잉 → 3D 애니메이션
DrawingSpinUp은 평평한 캐릭터 그림을 3D 효과가 적용된 역동적인 애니메이션으로 변환하는 혁신적인 3D 애니메이션 생성 기술로, 원본 아트워크의 스타일과 특성을 세심하게 보존합니다.
튜토리얼 단계를 따라 현실적이고 세부적인 3D 애니메이션을 만들어 보세요.
온라인으로 실행:https://go.hyper.ai/H9fV1

6. Whisper-large-v3-turbo 음성 인식 및 번역 데모
위스퍼는 범용 음성 인식 모델이다. 방대하고 다양한 오디오 데이터 세트를 사용하여 학습되었으며, 다국어 음성 인식 및 음성 번역과 같은 여러 작업을 수행할 수 있습니다.
이 튜토리얼은 whiplash-large-v3-turbo에 대한 원클릭 배포 튜토리얼입니다. Whisper-Large-V3보다 8배 빠르며 품질 손실도 거의 없습니다. 관련 환경과 종속성이 설치되었으며, 한 번의 클릭으로 복제하고 시작하여 체험해 볼 수 있습니다.
온라인으로 실행:https://go.hyper.ai/3P9nk

커뮤니티 기사
1. NVIDIA와 Samsung의 투자를 받아 Generate는 100만 개가 넘는 단백질을 생성하고 처음부터 설계된 생성 모델을 개발했습니다.
AI 생물제약 회사인 Generate: Biomedicines는 독특한 프로그래밍 가능 생물학 플랫폼을 통해 단백질 엔지니어링에 인공지능을 깊이 통합할 뿐만 아니라 과학자들이 전통적으로 약물 개발이 어려웠던 표적에 대해 더 효율적인 솔루션을 설계할 수 있도록 지원합니다. 최근 제너레이트는 삼성사이언스앤라이프사이언스펀드로부터 전략적 투자를 받았다고 발표했습니다. 이것의 중요성은 자명하다. 이 기사는 회사에 대한 자세한 보고서입니다. 클릭해서 빠르게 읽어보세요.
이벤트 요약 보기:https://go.hyper.ai/fVtKK
2. 갑골의 고충실도 데이터 중국으로 반환, AI가 고대 문헌 해석 지원, 새로운 갑골 이미지 발견
최근 들어 AI는 고대 중국 문학 연구 분야에 점차 더 깊이 적용되고 있습니다. 2024년 6월, 안양사범대학은 화중과학기술대학, 화남이공대학 등과 협력하여 갑골문 해독에 최적화된 조건부 확산 모델을 제안했습니다. 해당 연구 결과는 ACL 2024에 선정되었을 뿐만 아니라, 최우수 논문상도 성공적으로 수상했습니다. 이는 AI가 연구자들의 업무 효율성을 높이고 있음을 보여줍니다. AI가 갑골문을 해석하는 방법에 대한 자세한 내용은 다음과 같습니다.
전체 보고서 보기:https://go.hyper.ai/xzw4c
3. 10대 중국 의학 데이터 요약: 신농중의학, 고대 중의학 서적, 의학적 추론, 의학적 질문과 답변 등을 포함합니다.
의료 인공지능의 급속한 발전은 고품질 데이터 세트의 지원과 분리될 수 없습니다. 질병 진단부터 약물 개발, 개인 맞춤 의료에 이르기까지 데이터 세트는 의료 분야에서 머신 비전, 대형 모델 등의 적용을 촉진하는 데 없어서는 안 될 역할을 합니다. 이 글은 신농중의학, 고대 중의학 서적, 의학적 추론, 의학적 질문과 답변 등을 다루는 의학 분야의 데이터 세트 10개를 정리한 것입니다. 클릭해서 바로 다운로드할 수 있습니다.
전체 보고서 보기:https://go.hyper.ai/NHlJ0
4. 성공률은 100%에 도달할 수 있습니다. 약물 개발 회사 Cellarity는 강화 학습을 기반으로 표적 분자를 최적화하기 위해 NVIDIA와 협력했습니다.
인공지능의 급속한 발전은 신약 개발에 새로운 가능성을 가져왔습니다. 최근 생명과학 회사인 셀러리티와 엔비디아의 연구진은 잠재 강화 학습인 MOLRL을 기반으로 한 새로운 표적 분자 최적화 방법을 공동으로 제안했는데, 이 방법은 약물 발견 관련 작업, 특히 표적 분자 생성 및 다중 매개변수 최적화에서 뛰어난 성능을 보였습니다. 본 논문은 논문에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/YBhnM
5. 난카이대학교 정웨이 교수: 알파폴드는 완벽하지 않으며, 학계는 여전히 "곡선에서 추월할" 기회가 있습니다.
"AI4S를 만나다" 생방송 시리즈의 여섯 번째 에피소드에서 난카이대학교 통계 및 데이터 과학부의 정웨이 교수는 AlphaFold의 한계와 향후 최적화 방향, 그리고 학계에서 탐구할 가치가 있는 알고리즘과 연구 주제에 대해 모든 사람과 이야기를 나누었습니다. 자세한 내용은 아래를 참조하세요.
전체 보고서 보기:https://go.hyper.ai/YgCip
인기 백과사전 기사
1. 상호 정렬 융합 RRF
2. 모델 매개변수
3. 콜모고로프-아놀드 표현 정리
4. 대규모 멀티태스크 언어 이해(MMLU)
5. 대조 학습
다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event
위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!
다음주에 뵙겠습니다!