HyperAI초신경

코딩 문제와 작별하세요! Seed-Coder는 효율적인 프로그래밍을 가능하게 합니다. Mixture-of-Thoughts는 다중 도메인 데이터를 포괄하여 고품질 추론을 구현합니다.

特色图像

대형 모델 경쟁이 점점 더 치열해지고 "볼륨 기술 및 규모" 추세가 지속됨에 따라, 모델의 실제 사용성과 작업 성능을 어떻게 향상시킬 것인가가 더욱 중요한 과제가 되었습니다. 그중에서도 코딩 능력은 대형 모델의 사용성과 작업 성능을 측정하는 중요한 지표입니다. 이를 바탕으로 ByteDance Seed 팀은 가볍지만 강력한 오픈 소스 코드 기반 대형 언어 모델인 Seed-Coder-8B-Instruct를 출시했습니다.

이 모델은 Llama 3 아키텍처를 기반으로 구축된 Seed-Coder 시리즈의 미세 조정 버전으로, 8.2B 매개변수를 포함하고 최대 32K 토큰 길이의 컨텍스트 처리를 지원합니다.Seed-Coder-8B-Instruct 최소한의 인적 입력으로 LLM은 코드 학습 데이터를 스스로 효율적으로 관리하여 코딩 역량을 크게 향상시킬 수 있습니다. 고품질 학습 데이터를 스스로 생성하고 검토함으로써 모델 코드 생성 역량이 크게 향상될 수 있습니다.

현재 HyperAI Super Neural이 온라인 상태입니다. vLLM+Open WebUI 배포 Seed-Coder-8B-Instruct", 와서 드셔보세요~

온라인 사용:https://go.hyper.ai/BnO32

생방송 예약

Apple의 WWDC25 글로벌 컨퍼런스가 6월 10일 베이징 시간 오전 1시에 개최됩니다. HyperAI Super Neural Video가 기조연설을 실시간으로 중계합니다. 놓치고 싶지 않으시다면 지금 바로 예약하세요!

6월 3일부터 6월 6일까지 hyper.ai 공식 웹사이트가 업데이트됩니다.

* 고품질 공개 데이터 세트: 10

* 고품질 튜토리얼: 13개

* 이번 주 추천 논문 : 5

* 커뮤니티 기사 해석 : 4개 기사

* 인기 백과사전 항목: 5개

* 6월 마감일 상위 컨퍼런스: 2

공식 웹사이트를 방문하세요:하이퍼.AI

선택된 공개 데이터 세트

1. 눈 감지 안경 감지 데이터 세트

Eye Detection은 약 2,000개의 명확하게 레이블이 지정된 눈 영역 이미지를 포함하는 눈 감지 데이터셋으로, RCNN 및 YOLO와 같은 표적 감지 모델을 학습하여 눈 영역을 추적하고 감지하는 데 사용할 수 있습니다. 이 데이터셋은 백내장 감지 모델, 눈 추적 모델 등을 구축하는 데 사용할 수 있습니다.

직접 사용:https://go.hyper.ai/5IUPr

데이터 세트 프레젠테이션

2. Yambda 음악 추천 데이터 세트

Yambda-5B는 음악 추천, 정보 검색, 정렬과 같은 대규모 언어 모델(LLM)에 대한 훈련 및 평가 리소스를 제공하는 것을 목표로 하는 대규모 멀티모달 음악 분석 데이터셋입니다. 이 데이터셋은 47억 9천만 건의 상호작용(듣기, 좋아요, 싫어요 취소 포함)을 포함하고 있으며, 100만 명의 사용자와 939만 개의 트랙을 포함합니다. 현재 가장 큰 규모의 공개 음악 추천 데이터셋 중 하나입니다.

직접 사용:https://go.hyper.ai/VSL3J

데이터 세트 예제

3. 4x 위성 위성 이미지 데이터 세트

이 데이터 세트는 4배 초고해상도 작업을 위해 설계된 고해상도(HR) 및 저해상도(LR) 위성 이미지 쌍을 포함하는 고해상도 위성 이미지 데이터 세트입니다.

직접 사용:https://go.hyper.ai/TyCeW

4. MedXpertQA 의학적 추론 데이터 세트

이 데이터 세트에는 의학적 질문에 대한 답변, 임상 진단, 치료 계획 권장, 기본 의학 지식 이해와 같은 작업을 다루는 텍스트와 이미지 데이터를 통합한 4,460개의 샘플 데이터가 포함되어 있습니다. 복잡한 의학적 의사결정 역량에 대한 연구 개발을 지원하며, 의료 분야에서 중규모 모델의 미세 조정 및 평가에 적합합니다.

직접 사용:https://go.hyper.ai/YGW7J

5. 동물 소리 동물 소리 데이터 세트

이 데이터 세트에는 긴꼬리딱새와 얼룩말핀치와 같은 새, 개, 이집트과일박쥐, 거대수달, 원숭이, 범고래를 포함한 7종의 오디오를 포함하는 약 10,800개의 샘플이 포함되어 있습니다. 각 오디오의 길이는 1~5초로, 가벼운 모델 학습과 빠른 실험에 적합합니다.

직접 사용:https://go.hyper.ai/asUR4

6. GeMS 화학 질량 분석 데이터 세트

이 데이터셋은 수억 개의 질량 스펙트럼(예: GeMS-C1 하위 집합의 경우 20억 개)을 포함하고 있으며, 여기에는 구조화된 수치 데이터(질량 대 전하비-세기 쌍의 질량 스펙트럼)와 메타데이터(예: 스펙트럼 소스, 실험 조건 등)가 포함됩니다. 현재 이용 가능한 가장 큰 규모의 공개 질량 분석 데이터셋 중 하나이며, 초대규모 모델 학습을 지원할 수 있습니다.

직접 사용:https://go.hyper.ai/yXI9M

7. DeepTheorem 정리 증명 데이터 세트

DeepTheorem은 자연어 기반 비공식 정리 증명을 통해 대규모 언어 모델(LLM)의 수학적 추론 능력을 향상시키는 것을 목표로 하는 수학적 추론 데이터셋입니다. 이 데이터셋은 다양한 수학 분야를 포괄하는 121,000개의 IMO 수준 비공식 정리와 증명을 포함하고 있습니다. 각 정리-증명 쌍은 엄격하게 주석 처리되어 있습니다.

직접 사용:https://go.hyper.ai/fjnad

8. SynLogic 추론 데이터 세트

SynLogic은 검증 가능한 보상을 기반으로 강화 학습을 통해 대규모 언어 모델(LLM)의 논리적 추론 능력을 향상시키는 것을 목표로 합니다. 이 데이터셋은 자동 검증 기능을 갖춘 35개의 다양한 논리적 추론 과제를 포함하고 있어 강화 학습 훈련에 매우 적합합니다.

직접 사용:https://go.hyper.ai/iF5f2

9. 혼합 사고 추론 데이터 세트

Mixture-of-Thoughts는 수학, 프로그래밍, 과학의 세 가지 주요 분야에서 고품질 추론 트랙을 통합한 다중 도메인 추론 데이터셋입니다. 대규모 언어 모델(LLM)이 단계별 추론을 수행하도록 훈련하는 것을 목표로 합니다. 이 데이터셋의 각 샘플에는 추론 과정을 여러 라운드의 대화 형태로 저장하는 메시지 필드가 포함되어 있어, 모델이 단계별 추론 능력을 학습하도록 지원합니다.

직접 사용:https://go.hyper.ai/7Qo2l

10. 라마-네모트론 추론 데이터 세트

이 데이터셋은 약 2,206만 개의 수학 데이터와 약 1,010만 개의 코드 데이터를 포함하고 있으며, 나머지는 과학 및 교육 학습과 같은 분야의 데이터입니다. 이 데이터는 Llama-3.3-70B-Instruct, DeepSeek-R1, Qwen-2.5와 같은 여러 모델을 통해 공동으로 생성되었으며, 다양한 추론 스타일과 문제 해결 경로를 포괄하여 대규모 모델 학습의 다양한 요구를 충족합니다.

직접 사용:https://go.hyper.ai/4V52g

선택된 공개 튜토리얼

이번 주에는 고품질 공개 튜토리얼을 4가지 범주로 요약했습니다.

*과학 튜토리얼을 위한 AI: 4

* 이미지 처리 튜토리얼: 4

*코드 생성 튜토리얼: 3

*음성 상호작용 튜토리얼: 2

과학을 위한 AI 튜토리얼

1. 오로라 대규모 대기 기본 모델 데모

Aurora는 기존 운영 예측 시스템보다 성능이 뛰어나면서도 계산 비용을 크게 절감하여 고품질 기후 및 날씨 정보에 대한 광범위한 접근성을 제공합니다. Aurora는 가장 진보된 수치 예측 시스템인 IFS보다 약 5,000배 빠른 것으로 나타났습니다.

이 튜토리얼에서는 단일 카드 A6000을 리소스로 사용합니다. 컨테이너를 시작한 후 API 주소를 클릭하여 웹 인터페이스로 들어가세요.

온라인으로 실행:https://go.hyper.ai/416Xs

2. MedGemma-4b-it 멀티모달 의료 AI 모델의 원클릭 배포

MedGemma-4b-it는 의료 분야를 위해 특별히 설계된 다중 모드 의료 AI 모델입니다. MedGemma 제품군의 명령어 조정 버전입니다. 특별히 사전 학습된 SigLIP 이미지 인코더를 사용하며, 흉부 X선, 피부과 이미지, 안과 이미지, 조직병리학 섹션 등 식별 정보가 제거된 의료 이미지 데이터를 활용합니다.

이 튜토리얼에서는 리소스로 단일 RTX 4090 카드를 사용합니다. 컨테이너를 시작한 후 API 주소를 클릭하여 웹 인터페이스로 들어갑니다.

온라인으로 실행:https://go.hyper.ai/31RKp

3. MedGemma-27b-text-it 의학적 추론 모델의 원클릭 배포

이 모델은 임상 텍스트 처리에 중점을 두고 있으며, 특히 환자 분류 및 의사 결정 지원에 효과적입니다. 의사에게 신속하고 귀중한 환자 상태 정보를 제공하여 효율적인 치료 계획을 수립하는 데 도움이 됩니다.

이 튜토리얼에서는 듀얼 SIM A6000 리소스를 사용합니다. 아래 링크를 열어 클릭 한 번으로 배포하세요.

온라인으로 실행:https://go.hyper.ai/2mDmF

4. vLLM+Open WebUI 구축 II-Medical-8B 의학적 추론 모델

이 모델은 Qwen/Qwen3-8B 모델을 기반으로 하며, 의료 관련 추론 데이터 세트를 사용하여 SFT(지도 미세 조정)를 사용하고 하드 추론 데이터 세트에서 DAPO(가능한 최적화 방법)를 학습하여 모델 성능을 최적화합니다.

이 튜토리얼에서 사용된 컴퓨팅 리소스는 RTX 4090 카드 1개입니다.

온라인으로 실행:https://go.hyper.ai/1Qvwo

이미지 처리 튜토리얼

1. DreamO: 통합 이미지 사용자 정의 프레임워크

DreamO는 DiT(Diffusion Transformer) 아키텍처를 기반으로 다양한 영상 생성 작업을 통합하고, 의상 변경(IP), 얼굴 변경(ID), 스타일 전환(Style), 다중 피사체 조합 등의 복잡한 기능을 지원하며, 단일 모델을 통해 다중 조건 제어를 실현합니다.

이 튜토리얼에서는 단일 카드 A6000에 대한 리소스를 사용합니다.

온라인으로 실행:https://go.hyper.ai/zGGbh

2. BAGEL: 다중 모드 이해 및 생성을 위한 통합 모델

BAGEL-7B-MoT는 텍스트, 이미지, 비디오와 같은 다중 모드 데이터의 이해 및 생성 작업을 균일하게 처리하도록 설계되었습니다. BAGEL은 다중 모드 이해 및 생성, 복잡한 추론 및 편집, 월드 모델링 및 탐색과 같은 다중 모드 작업에서 포괄적인 역량을 입증했습니다. 주요 기능으로는 시각적 이해, 텍스트-이미지 생성, 이미지 편집 등이 있습니다.

이 튜토리얼에서는 듀얼 카드 A6000 컴퓨팅 리소스를 사용하고 테스트를 위해 이미지 생성, Think를 사용한 이미지 생성, 이미지 편집, Think를 사용한 이미지 편집 및 이미지 이해를 제공합니다.

온라인으로 실행:https://go.hyper.ai/76cEZ

데모 예제

3. ComfyUI Flex.2-미리보기 워크플로 온라인 튜토리얼

Flex.2-preview는 입력된 텍스트 설명을 기반으로 고품질 이미지를 생성하고, 최대 512개의 토큰까지 텍스트 입력을 지원하며, 복잡한 설명을 이해하여 해당 이미지 콘텐츠를 생성할 수 있도록 지원합니다. 또한 이미지의 특정 영역을 복구하거나 대체하는 기능도 지원합니다. 사용자가 복구 이미지와 복구 마스크를 제공하면 모델은 지정된 영역에 새로운 이미지 콘텐츠를 생성합니다.

이 튜토리얼에서는 리소스로 단일 RTX 4090 카드를 사용하며 영어 프롬프트만 지원합니다.

온라인으로 실행:https://go.hyper.ai/MH5qY

4. ComfyUI LanPaint 이미지 복원 워크플로 튜토리얼

LanPaint는 혁신적인 추론 방식을 사용하여 추가 학습 없이 다양한 안정 확산 모델(커스텀 모델 포함)에 적응하여 고품질 이미지 복원을 달성하는 오픈 소스 이미지 로컬 복원 도구입니다. 기존 방식과 비교하여 LanPaint는 학습 데이터 및 컴퓨팅 리소스에 대한 수요를 크게 줄이는 경량 솔루션을 제공합니다.

이 튜토리얼에서는 RTX 4090 카드 한 장을 사용합니다. 아래 링크를 열면 모델을 빠르게 복제할 수 있습니다.

온라인으로 실행:https://go.hyper.ai/QAuag

코드 생성 튜토리얼

1. vLLM+Open WebUI 배포 Seed-Coder-8B-Instruct

Seed-Coder-8B-Instruct는 가볍지만 강력한 오픈 소스 코드 언어 모델입니다. Seed-Coder 명령어 시리즈를 미세 조정한 버전입니다. LLM은 최소한의 인력으로 코드 학습 데이터를 자체적으로 효과적으로 관리하여 코딩 역량을 크게 향상시킵니다. 이 모델은 Llama 3 아키텍처를 기반으로 하며, 82억 개의 매개변수를 포함하고 32,000개의 토큰 길이의 컨텍스트를 지원합니다.

이 튜토리얼에서 사용된 컴퓨팅 리소스는 RTX 4090 카드 1개입니다.

온라인으로 실행:https://go.hyper.ai/BnO32

2. Mellum-4b-base는 코드 완성을 위해 설계된 모델입니다.

Mellum-4b-base는 코드 이해, 생성 및 최적화 작업을 위해 설계되었습니다. 이 모델은 전체 소프트웨어 개발 프로세스에서 탁월한 성능을 보여주며, AI 기반 프로그래밍, 지능형 IDE 통합, 교육 도구 개발 및 코드 연구와 같은 시나리오에 적합합니다.

이 튜토리얼에서는 리소스로 단일 RTX 4090 카드를 사용하고, 모델은 코드를 최적화하는 데에만 사용됩니다.

온라인으로 실행:https://go.hyper.ai/2iEWz

3. OpenCodeReasoning-Nemotron-32B의 원클릭 배포

이 모델은 코드 추론 및 생성을 위해 설계된 고성능 대규모 언어 모델입니다. OpenCodeReasoning(OCR) 모델 모음의 주력 버전이며, 32,000 토큰의 컨텍스트 길이를 지원합니다.

이 튜토리얼에서 사용된 컴퓨팅 리소스는 듀얼 카드 A6000입니다.

온라인으로 실행:https://go.hyper.ai/jhwYd

음성 상호작용 튜토리얼

1. VITA-1.5: 다중 모드 상호작용 모델 데모

ITA-1.5는 시각, 언어, 음성을 통합하는 다중 모드 대규모 언어 모델로, GPT-4o와 유사한 수준의 실시간 시각 및 음성 상호작용을 구현하도록 설계되었습니다. VITA-1.5는 상호작용 지연 시간을 4초에서 1.5초로 크게 줄여 사용자 경험을 크게 향상시킵니다.

이 튜토리얼에서는 리소스로 단일 카드 A6000을 사용합니다. 현재 AI 상호작용은 중국어와 영어만 지원합니다.

온라인으로 실행:https://go.hyper.ai/WTcdM

2. Kimi-Audio: AI가 인간을 이해하게 하세요

Kimi-Audio-7B-Instruct는 단일 통합 프레임워크 내에서 다양한 오디오 처리 작업을 처리할 수 있는 오픈 소스 오디오 인프라 모델입니다. 자동 음성 인식(ASR), 오디오 질의응답(AQA), 자동 오디오 자막(AAC), 음성 감정 인식(SER), 사운드 이벤트/장면 분류(SEC/ASC), 그리고 엔드 투 엔드 음성 대화 등 다양한 작업을 처리할 수 있습니다.

이 튜토리얼에서는 단일 카드 A6000에 대한 리소스를 사용합니다.

온라인으로 실행:https://go.hyper.ai/UBRBP

이번 주 논문 추천

1. 지구 시스템의 기초 모델

본 논문에서는 100만 시간 이상의 다양한 지구물리학 데이터를 학습한 대규모 기반 모델인 오로라 모델을 제안합니다. 이 모델은 대기 질, 해양 파도, 열대성 저기압 경로, 고해상도 날씨 예측 측면에서 기존 운영 예측 시스템보다 우수한 성능을 보입니다.

논문 링크:https://go.hyper.ai/ibyij

2. Paper2Poster: 과학 논문을 활용한 다중 모달 포스터 자동화

학술 논문 포스터 제작은 과학 커뮤니케이션에서 중요하고 까다로운 작업으로, 긴 인터리브 문서를 시각적으로 일관된 내용의 한 페이지로 압축해야 합니다. 이러한 과제를 해결하기 위해 본 논문에서는 22페이지 분량의 논문을 편집 가능한 최종 PPTX 포스터로 변환할 수 있는 최초의 학술 논문 포스터 제작 벤치마크 및 측정 도구를 소개합니다.

논문 링크:https://go.hyper.ai/Q4cQG

3. ProRL: 장기 강화 학습을 통해 대규모 언어 모델의 추론 경계 확장

강화 학습이 모델의 추론 능력을 실제로 확장하는지 여부는 여전히 논란의 여지가 있습니다. 본 논문에서는 KL 발산 제어, 참조 정책 재설정, 그리고 다양한 작업 세트를 결합한 새로운 학습 방법인 ProRL을 제안합니다. 이를 통해 강화 학습이 언어 모델의 추론 경계를 의미 있게 확장하는 조건에 대한 더 나은 이해를 위한 새로운 통찰력을 제공합니다.

논문 링크:https://go.hyper.ai/62DUb

4. GRPO를 통한 다중 모달 LLM 추론을 위한 비지도 사후 학습

본 연구는 안정적이고 확장 가능한 온라인 강화 학습 알고리즘인 GRPO를 사용하여 외부 지도 없이 지속적인 자기 개선을 달성하고, 다중 모드 대규모 언어 모델을 위한 간단하고 효과적인 비지도 사후 학습 프레임워크인 MM-UPT를 제안합니다. 실험 결과, MM-UPT가 Qwen2.5-VL-7B의 추론 능력을 크게 향상시킴을 보여줍니다.

논문 링크:https://go.hyper.ai/W5nO5

5. 추론 언어 모델을 위한 강화 학습의 엔트로피 메커니즘

본 논문은 대규모 강화 학습(RL)에서 추론에 대규모 언어 모델(LLM)을 사용할 때 발생하는 주요 장애물, 즉 정책 엔트로피 붕괴를 극복하는 것을 목표로 합니다. 이를 위해 연구진은 두 가지 간단하고 효과적인 방법, 즉 Clip-Cov와 KL-Cov를 제안했습니다. Clip-Cov는 공분산이 높은 토큰을 클리핑하는 반면, KL-Cov는 이러한 토큰에 KL 페널티를 부과합니다. 실험 결과는 이러한 방법들이 탐색 행동을 촉진하여 정책이 엔트로피 붕괴를 피하고 더 나은 후속 성능을 달성하는 데 도움이 될 수 있음을 보여줍니다.

논문 링크:https://go.hyper.ai/rFSoq

더 많은 AI 프런티어 논문:https://go.hyper.ai/UuE1o

커뮤니티 기사 해석

1. 체코 과학 아카데미는 2억 개의 분자량 스펙트럼을 포괄하는 세계 최대 규모의 질량 분석 데이터 세트인 GeMS를 구축하기 위해 DreaMS 모델을 출시했습니다.

체코 과학 아카데미 산하 유기화학 및 생화학 연구소의 연구팀은 언어 분야에서 GPT 시리즈가 이룬 획기적인 성과를 바탕으로 글로벌 천연물 사회 분자 네트워크(GNPS)에서 7억 개의 MS/MS 스펙트럼을 채굴하고, 역사상 가장 큰 질량 분석 데이터 세트인 GeMS를 성공적으로 구축하고, 1억 1,600만 개의 매개변수를 갖는 Transformer 모델 DreaMS를 훈련시켰습니다.

전체 보고서 보기:https://go.hyper.ai/P9qvl

2. AI 컴파일러 기술 살롱 | AMD/베이징대/무석/상하이창즈 베이징에 모여, TVM/트리톤/타일랑의 강점을 과시

최첨단 연구를 응용 시나리오와 더욱 효과적으로 연결하기 위해 HyperAI는 7월 5일 베이징에서 제7회 AI 컴파일러 기술 살롱을 개최할 예정입니다. AMD, 베이징 대학, Muxi Integrated Circuit 등의 고위 전문가를 초대하여 AI 컴파일러에 대한 모범 사례와 추세 분석을 공유하게 되어 기쁘게 생각합니다.

전체 보고서 보기:https://go.hyper.ai/FPxw2

3. 심층 강화 학습을 통해 도시 화재 최적화가 가능해졌습니다. 중국과학원 연구팀은 시설물 구성 문제를 해결하기 위해 새로운 DRL(지능형 화재 경보 시스템) 기법을 제안했습니다.

중국과학원 우주정보혁신연구소의 량 하오젠 박사는 중국지리학회 지리모델 및 지리정보분석 전문가위원회 2025년 학술대회에서 "계층적 심층 강화학습 기반 도시 비상소방시설 배치 최적화 방법 연구"라는 제목으로 강연했습니다. 본 강연에서는 도시 비상소방시설 배치 최적화를 출발점으로 삼아 공간 최적화 분야의 기존 최적화 방법들을 체계적으로 검토하고, 심층 강화학습(DRL) 기반 최적화 방법의 장점과 잠재력을 자세히 소개했습니다. 본 논문은 량 하오젠 박사의 발표 내용 중 주요 내용을 요약한 것입니다.

전체 보고서 보기:https://go.hyper.ai/xvnAI

4. 온라인 튜토리얼 | 싱가포르 국립대학교 Show Lab, 플러그 앤 플레이 이미지 스타일 전송을 위한 OmniConsistency 모델 출시

싱가포르 국립대학교의 Show Lab은 2025년 5월 28일에 대규모 확산 변환기(DiT)를 사용하는 범용 일관성 플러그인인 OmniConsistency를 출시했습니다. 이 플러그인은 Flux 프레임워크 하의 모든 스타일의 LoRA와 호환되는 완전한 플러그 앤 플레이 설계로, 양식화된 이미지 쌍에 대한 일관성 학습 메커니즘을 기반으로 견고한 일반화를 달성합니다.

전체 보고서 보기:https://go.hyper.ai/etmWQ

인기 백과사전 기사

1. 달-이

2. 인간-기계 루프

3. 역순 정렬 퓨전

4. 양방향 장기 단기 기억

5. 대규모 멀티태스크 언어 이해

다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

https://go.hyper.ai/wiki

정상회담 6월 마감일

S&P 2026 6월 6일 7:59:59

ICDE 2026 6월 19일 7:59:59

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event

위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. 포함하려면 하이퍼.AI 공식 웹사이트의 리소스에 대해 알고 싶으시다면, 메시지를 남기시거나 의견을 남겨주세요!

다음주에 뵙겠습니다!