HyperAI초신경

지브리 스타일의 그림을 제작하는 도구인 EasyControl이 클릭 한 번으로 실행됩니다. 단일 이미지를 몇 초 만에 3D 모델로 변환할 수 있으며 TripoSG는 3D 자산 생성에 혁신을 가져왔습니다.

特色图像

최근 지브리 스타일의 이미지가 소셜 미디어를 강타하고 있습니다. 사람들이 영화나 TV 시리즈에 하야오 미야자키의 애니메이션 스타일 필터를 추가하면, 마치 판타지로 가득 찬 동화 세계에 들어온 듯한 느낌을 받습니다. 하지만 지브리 스타일의 그림을 직접 만들고 싶어하는 많은 사용자에게는 기존 생성 모델이 복잡한 작동, 높은 사용 임계값 또는 만족스럽지 못한 생성 효과와 같은 문제점을 겪는 경우가 많습니다.

EasyControl은 첨단 기술과 간단하고 사용하기 쉬운 인터페이스를 통해 창작의 한계를 크게 낮춰줍니다.가벼운 조건부 주입을 소개합니다. LoRA 모듈, 위치 인식 훈련 패러다임 및인과적 주의 메커니즘그리고 KV 캐시 기술모델 호환성이 크게 향상되고 플러그 앤 플레이 기능과 비파괴적 스타일 제어가 지원됩니다.

현재,하이퍼AI"EasyControl Ghibli 스타일 이미지 생성 데모" 튜토리얼이 출시되었습니다.데모에서는 양식화된 Img2Img 제어 모델을 사용하여 초상화를 변환합니다.미야자키 스타일예술작품, 와서 감상해보세요~

온라인 사용:https://go.hyper.ai/jWm9j

4월 21일부터 4월 25일까지 hyper.ai 공식 웹사이트가 업데이트됩니다.

* 고품질 공개 데이터 세트: 10

* 고품질 튜토리얼: 12개

* 커뮤니티 기사 선정: 4개 기사

* 인기 백과사전 항목: 5개

* 4월 마감일 상위 컨퍼런스: 1

공식 웹사이트를 방문하세요:하이퍼.AI

선택된 공개 데이터 세트

1. 스페인 교통 항공 이미지 데이터 세트

이 데이터 세트에는 무인 항공기(UAV)가 촬영한 15,070개의 이미지 프레임이 포함되어 있으며, 지역 도로, 도시 교차로, 시골 도로, 여러 유형의 원형 교차로를 포함한 다양한 교통 시나리오를 다룹니다. 이미지에는 155,328개의 사물에 대한 주석이 달려 있는데, 그 중 137,602개가 자동차이고 17,726개가 오토바이입니다. 이 이미지들은 YOLO 형식저장소는 합성 신경망을 기반으로 한 머신 비전 알고리즘을 훈련하는 데 편리합니다.

직접 사용:https://go.hyper.ai/VJoXE

데이터 세트 예제

2. CAMUS 심장 초음파 영상 데이터 세트

이 데이터 세트에는 프랑스의 생테티엔 대학 병원에서 수집한 500명의 환자로부터 얻은 2D 정점 4방실 및 2방실 시야 시퀀스가 포함되어 있으며, 환자의 개인 정보 보호 및 데이터 규정 준수를 보장하기 위해 완전히 익명화되었습니다. 각 이미지에는 전문 의료진이 정확하게 주석을 달았으며, 좌심실 내막, 좌심실 외막, 좌심방의 윤곽 정보를 포함하고 있습니다. 이러한 자세한 주석은 연구자들에게 풍부한 교육 및 검증 리소스를 제공합니다.

직접 사용:https://go.hyper.ai/iYtn2

데이터 세트 예제

3. 항공 사진 속 선박/선박

이 데이터 세트에는 "배"라는 이미지 카테고리만 포함된 26.9k개의 이미지가 포함되어 있습니다. 이러한 이미지에는 선박 탐지를 위해 특별히 주의 깊게 주석이 달려 있습니다. 경계 상자 주석은 YOLO 형식으로 표현되며, 이를 통해 이미지에서 배를 정확하고 효율적으로 감지할 수 있습니다.

직접 사용:https://go.hyper.ai/s03Tk

데이터 세트 예제

4. SkyCity Aerial City Landscape City Landscape 항공 사진 데이터 세트

이 데이터 세트는 항공 풍경 분류를 위해 선택된 데이터 세트로, 총 8k 이미지로 구성되어 있으며, 10개의 다른 카테고리가 있고, 각 카테고리에는 256×256픽셀의 해상도를 가진 800개의 고품질 이미지가 포함되어 있습니다. 이 데이터 세트는 공개적으로 이용 가능한 AID와 NWPU-Resisc45 데이터 세트의 도시 경관을 모아 도시 경관 분석을 용이하게 하는 것을 목표로 합니다.

직접 사용:https://go.hyper.ai/eCRdN

데이터 세트 예제

5. 302개의 희귀질환 사례 데이터 세트

이 데이터 세트에는 302개의 희귀 질병이 포함되어 있으며, 각 범주에서 1~9개의 희귀 질병이 무작위로 선택되었습니다. 이러한 희귀 질환은 유럽 위원회가 공동 자금을 지원한 포괄적인 희귀 질환 데이터베이스인 Orphanet 데이터베이스에 있는 33개 유형의 7,000개 이상의 희귀 질환에서 선정되었습니다.

직접 사용:https://go.hyper.ai/LwqME

6. DRfold2 RNA 구조 검정 데이터 세트

이 데이터 세트는 이 연구에서 DRfold2의 성능을 객관적으로 평가하기 위해 구성된 독립적인 테스트 데이터 세트입니다. 여기에는 서열 길이가 400nt 미만인 RNA 구조 28개가 포함되어 있으며 다음 3가지 범주에 속합니다. 최신 RNA-퍼즐 타겟 서열; CASP15 경쟁에서의 RNA 표적 시퀀스; 그리고 2024년 8월 1일 기준 단백질 데이터 뱅크(PDB) 데이터베이스에 게시된 최신 RNA 구조입니다.

직접 사용:https://go.hyper.ai/shkp6

7. HMC-QU 심장 의료 영상 데이터셋

이 데이터 세트에는 2018년과 2019년에 획득한 정점 4심방(A4C) 및 정점 2심방(A2C) 영상의 2차원 심초음파(에코) 기록이 포함되어 있습니다. 기록은 다양한 제조업체(예: Phillips 및 GE Vivid 초음파 장비)의 장비를 통해 획득되었으며, 시간 해상도는 초당 25프레임, 공간 해상도는 422×636~768×1024픽셀입니다.

직접 사용:https://go.hyper.ai/gQN8a

8. Reasoning-v1-20m 추론 데이터 세트

Reasoning-v1-20m에는 수학, 프로그래밍, 과학 등 여러 분야의 복잡한 문제를 다루는 약 2,000만 개의 추론 추적이 포함되어 있습니다. 이 데이터 세트는 추론 과정에 대한 풍부한 예를 제공하여 모델이 복잡한 추론 논리를 학습하고 다단계 추론 작업에서 성능을 향상시키는 데 도움을 주는 것을 목표로 합니다.

직접 사용:https://go.hyper.ai/c2RqP

9. II-Thought-RL-v0 다중 작업 질의응답 데이터 세트

II-Thought-RL-v0는 강화 학습과 문제 해결을 위해 설계된 대규모 다중 작업 데이터 세트입니다. 여기에는 수학, 프로그래밍, 과학 등 다양한 분야를 포괄하여 여러 단계를 거쳐 엄격하게 필터링된 고품질의 질문-답변 쌍이 포함되어 있습니다. 데이터 세트의 질문 쌍은 공개 데이터 세트에서 가져온 것뿐만 아니라, 데이터의 다양성과 실용성을 보장하기 위해 맞춤형 고품질 질문 쌍도 포함합니다.

직접 사용:https://go.hyper.ai/9eSSq

10. AM-DeepSeek-R1-Distilled-1.4M 대규모 일반 추론 과제 데이터 세트

이 데이터 세트에는 수학, 코드, 과학 Q&A, 일반 채팅을 포함한 다양한 질문 유형을 포괄하는 약 140만 개의 데이터 항목이 포함되어 있습니다. 이러한 데이터는 신중하게 선택되고, 의미적으로 중복이 제거되고, 엄격하게 정리되어 데이터의 높은 품질과 난이도가 보장됩니다. 데이터 세트의 각 항목에는 풍부한 사고 추적이 포함되어 있습니다. 이는 모델에 추론 과정의 예를 제공할 뿐만 아니라 모델이 복잡한 추론 작업을 더 잘 이해하고 솔루션을 생성하는 데 도움이 됩니다.

직접 사용:https://go.hyper.ai/2PSxR

선택된 공개 튜토리얼

1. YOLOE: 모든 것을 실시간으로 확인하세요

YOLOE는 2025년 청화대학교 연구팀이 제안한 새로운 실시간 시각 모델로, "모든 것을 실시간으로 보는 것"이라는 목표를 달성하는 것을 목표로 합니다. YOLO 시리즈 모델의 실시간성과 효율성 특성을 그대로 이어받았으며, 이를 기반으로 제로샷 학습과 멀티모달 프롬프팅 기능을 깊이 통합하여 텍스트, 비전, 무음 프롬프팅 등 다양한 시나리오에서 타겟 탐지 및 세분화를 지원할 수 있습니다.

이 프로젝트의 관련 모델과 종속성이 배포되었습니다. 컨테이너를 시작한 후 API 주소를 클릭하여 웹 인터페이스로 들어갑니다.

온라인으로 실행:https://go.hyper.ai/rOIS1

모델이 수행한 객체 감지

2. R1-OneVision의 원클릭 배포

R1-OneVision은 저장대학교의 한 팀이 발표한 대규모 다중 모드 추론 모델입니다. 이 모델은 R1-Onevision 데이터 세트의 Qwen2.5-VL을 기반으로 미세 조정되었습니다. 복잡한 시각적 추론 작업을 처리하고 시각적 데이터와 텍스트 데이터를 원활하게 통합하는 데 효과적입니다. 수학, 과학, 심층적 이미지 이해, 논리적 추론 등의 분야에서 좋은 성과를 보이며, 다양한 문제를 해결하는 강력한 AI 보조자 역할을 할 수 있습니다.

이 튜토리얼에서는 데모로 R1-Onevision-7B를 사용하고, 컴퓨팅 리소스에는 RTX 4090을 사용합니다. 컨테이너를 시작한 후 API 주소를 클릭하여 웹 인터페이스로 들어갑니다.

온라인으로 실행:https://go.hyper.ai/7I2pi

데모 예제

3. UNO: 범용 맞춤형 이미지 생성

UNO 프로젝트는 단일 주제와 다중 주제 이미지 생성을 모두 지원하여 여러 작업을 하나의 모델로 통합하고 강력한 일반화 역량을 보여줍니다.

이 프로젝트는 FLUX.1-dev-fp 8을 기반으로 하며, 텍스트를 빠르게 인식하고 텍스트 설명을 기반으로 이미지를 생성할 수 있습니다.

온라인으로 실행:https://go.hyper.ai/r8JZo

데모 예제

4. TripoSG: 단 몇 초 만에 단일 이미지를 고화질 3D로 변환

TripoSG는 높은 충실도, 높은 품질, 높은 일반성을 갖춘 고급 이미지-3D 생성 기반 모델입니다. 대규모 정류 변압기, 하이브리드 지도 학습 및 고품질 데이터 세트를 활용하여 3D 모양 생성에서 최첨단 성능을 달성합니다.

이 프로젝트의 관련 모델과 종속성이 배포되었습니다. 컨테이너를 시작한 후 API 주소를 클릭하여 웹 인터페이스로 들어갑니다.

온라인으로 실행:https://go.hyper.ai/rcWwu

데모 예제

5. InfiniteYou 고화질 이미지 생성 데모

InfiniteYou는 InfU로 줄여서 부르며, ByteDance의 지능형 창작팀이 2025년에 출시한 Diffusion Transformers(FLUX 등)를 기반으로 한 신원 보존 이미지 생성 프레임워크입니다. 첨단 기술을 통해 이미지를 생성하는 동안 개인의 신원 일관성을 유지하여 신원 유사성, 텍스트-이미지 정렬 및 생성 품질 측면에서 기존 방식의 단점을 해결합니다.

이 튜토리얼에서는 InfiniteYou-FLUX v1.0을 데모로 사용하고, 컴퓨팅 파워 리소스는 A6000입니다. 아래 링크를 클릭하면 모델을 빠르게 복제할 수 있습니다.

온라인으로 실행:https://go.hyper.ai/K5Yl5

데모 예제

6. DeepCoder-14B-Preview의 원클릭 배포

DeepCoder-14B-Preview 프로젝트는 AGENTICA가 2025년 4월 8일에 발표한 14B 인코딩 모델입니다. 이 모델은 코드 추론을 위해 DeepSeek-R1-Distilled-Qwen-14B LLM에서 미세 조정되었으며, 분포 강화 학습(RL)을 사용하여 긴 컨텍스트 길이에 맞춰 확장됩니다. 이 모델은 LiveCodeBench v5(8/1/24-2/1/25)에서 60.6%의 Pass@1 정확도를 달성했으며, 이는 기본 모델(53%)보다 8%가 향상되었고, 매개변수가 14B에 불과한 OpenAI의 o3-mini와 비슷한 성능을 달성했습니다.

이 튜토리얼에서는 DeepCoder-14B-Preview 모델을 데모 케이스로 사용하고 bitsandbytes가 제공하는 8비트 양자화 방법을 채택하여 비디오 메모리 사용을 최적화합니다.

온라인으로 실행:https://go.hyper.ai/17aD2

데모 예제

7. EasyControl Ghibli 스타일 이미지 생성 데모

EasyControl은 확산 변압기에 효율적이고 유연한 제어 기능을 추가하는 것을 목표로 하는 프로젝트입니다. 이 프로젝트는 가벼운 조건부 주입 LoRA 모듈과 위치 인식 학습 패러다임을 도입하고, 인과적 주의 메커니즘과 KV 캐시 기술을 결합하여 플러그 앤 플레이 기능과 손실 없는 스타일 제어를 지원함으로써 모델 호환성을 크게 개선합니다.

이 튜토리얼에서는 Stylized Img2Img Controls 모델을 사용하여 얼굴 특징을 보존하고 상징적인 애니메이션 미학을 적용하면서 초상화를 하야오 미야자키 스타일의 예술 작품으로 변환할 수 있습니다.

온라인으로 실행:https://go.hyper.ai/jWm9j

데모 예제

8. Qwen2.5-0mni: 읽기, 듣기, 쓰기를 위한 전체 모드 지원

Qwen2.5-Omni는 알리바바의 Tongyi Qianwen 팀이 출시한 최신 엔드투엔드 멀티모달 플래그십 모델입니다. 이 솔루션은 포괄적인 다중 모드 인식을 위해 설계되었으며, 텍스트, 이미지, 오디오, 비디오 등 다양한 입력을 원활하게 처리하고 스트리밍 텍스트 생성과 자연스러운 음성 합성 출력을 지원합니다.

이 튜토리얼에서는 데모로 Qwen2.5-Omni를 사용하며, 컴퓨팅 리소스는 A6000입니다.

온라인으로 실행:https://go.hyper.ai/eghWg

데모 예제

9. Qwen2.5-VL-32B-Instruct의 원클릭 배포

Qwen2.5-VL-32B-Instruct는 Alibaba Tongyi Qianwen 팀이 개발한 오픈 소스 멀티모달 대형 모델입니다. Qwen2.5-VL 시리즈를 기반으로 한 이 모델은 강화 학습 기술을 통해 최적화되었으며, 32B 매개변수 규모로 다중 모드 기능에서 획기적인 성과를 달성했습니다.

이 튜토리얼에서는 Qwen2.5-VL-32B를 데모로 사용하며, 컴퓨팅 리소스는 A6000*2입니다. 기능에는 텍스트 이해, 이미지 이해, 비디오 이해가 포함됩니다.

온라인으로 실행:https://go.hyper.ai/Dp2Pd

데모 예제

10. 원클릭 배포 Qwen2.5-VL-32B-Instruct-AWQ

Qwen2.5-VL-32B-Instruct-AWQ는 Qwen2.5-VL-32B-Instruct의 양자화된 버전으로, 프로그래밍 및 수학적 컴퓨팅 기능을 크게 향상시킵니다. 이 모델은 29개 언어로 상호작용을 지원하고, 128,000개 토큰의 긴 텍스트를 처리할 수 있으며, 구조화된 데이터 이해 및 JSON 생성과 같은 핵심 기능을 갖추고 있습니다. 트랜스포머 아키텍처를 기반으로 개발되었으며, 양자화 기술을 통해 효율적인 배포를 달성하고 대규모 AI 애플리케이션 시나리오에 적합합니다.

이 프로젝트의 관련 모델과 종속성이 배포되었습니다. 컨테이너를 시작한 후 API 주소를 클릭하여 웹 인터페이스로 들어갑니다.

온라인으로 실행:https://go.hyper.ai/fAYEK

11. 온라인 튜토리얼: o3-mini와 비슷한 오픈소스 코드 추론 모델 DeepCoder-14B-Preview는 3천개의 별을 받았습니다.

DeepCoder-14B-Preview는 출시 이후 코드 이해 및 추론 작업에서 탁월한 성능을 보여 GitHub에서 3,000개 이상의 별을 받았습니다. 이 모델은 여러 평가에서 o3-mini와 비슷한 성능을 보였으며, 효율적인 추론 성능과 우수한 확장성을 가지고 있습니다.

개발자가 모델을 빠르게 경험하고 배포할 수 있도록 돕기 위해 HyperAl 공식 웹사이트의 튜토리얼 섹션에서 "DeepCoder-14B-Preview의 원클릭 배포" 튜토리얼을 출시했습니다. 아래 링크를 클릭하여 빠르게 시작하세요.

온라인으로 실행:https://go.hyper.ai/V42RT

12. 40개 이상의 주류 모델과 데이터 세트를 포괄하는 상하이 교통대학교 팀은 원스톱 단백질 엔지니어링 설계 플랫폼 VenusFactory를 출시했으며, 원클릭 배포 튜토리얼이 이제 온라인에 있습니다.

AI 단백질 공학의 응용과 개발을 촉진하기 위해 상하이 교통대학의 홍량 교수 연구팀은 단백질 공학에 특화된 원스톱 오픈 플랫폼인 VenusFactory를 개발했습니다. 연구자들은 복잡한 코드를 작성하지 않고도 40개 이상의 최첨단 단백질 딥러닝 모델을 쉽게 호출할 수 있습니다.

현재 HyperAI 공식 웹사이트에서는 "VenusFactory 단백질 공학 설계 플랫폼"에 대한 원클릭 배포 튜토리얼을 출시했습니다. 복제를 클릭하면 클릭 한 번으로 시작됩니다.

온라인으로 실행:https://go.hyper.ai/TnskV

커뮤니티 기사

1. CVPR 2025에 선정된 상하이 AI 랩 등은 11개 데이터세트에서 SOTA를 달성한 최초의 풀모달리티 의료 이미지 재식별 프레임워크를 제안했습니다.

상하이 인공지능 연구소와 여러 대학이 제안한 마미 모델, 혁신적으로 연속 모달 매개변수 어댑터를 도입하여 기존 단일 모달리티의 한계를 깨고 통합 모델이 X선 및 CT와 같은 여러 입력 모달리티에 실시간으로 적응할 수 있게 했습니다. 11개의 공공 의료 영상 데이터 세트를 기준으로 평가한 결과, MaMI는 최첨단 재식별 성능을 보여주었으며, 개인화된 의료에서 정확하고 동적인 과거 이미지 검색에 대한 강력한 지원을 제공했습니다. 이 글은 연구에 대한 자세한 해석과 공유입니다.

전체 보고서 보기:https://go.hyper.ai/e8Eat

2. 90%는 R&D 속도가 100배 빠르고 비용은 절감됩니다! AI 소재 회사 Phaseshift Technologies가 에너지/항공우주/광산/자동차용 합금을 개발합니다.

캐나다의 첨단 소재 회사인 Phaseshift Technologies는 AI 기술과 다중 규모 시뮬레이션을 사용하여 차세대 합금 및 복합재를 개발하는 데 전념하고 있습니다. 90%의 Rapid Alloy Design(RAD™) 플랫폼을 사용하면 다양한 산업의 특정 요구 사항과 시나리오에 맞춰 맞춤형 합금을 개발하여 기존 방식보다 소재 개발 속도를 100배까지 높이고 비용을 절감할 수 있습니다. 이 기사는 회사에 대한 자세한 보고서입니다.

전체 보고서 보기:https://go.hyper.ai/da4VH

3. 효소 반응 속도 매개변수 예측, 병목 현상 식별... 중국과학원 선전선진기술연구소의 뤄샤오저우는 효소 분야에서 AI의 혁신적인 응용 사례를 공유했습니다.

중국과학원 선전선진기술연구소의 뤄샤오저우 교수는 상하이 교통대학에서 주최한 "미래가 왔다" AI 단백질 설계 서밋에서 "인공지능 기반 효소 공학"이라는 주제로 심도 있는 프레젠테이션을 했습니다. UniKP 프레임워크와 ProEnsemble 머신과 같은 다양한 관점에서 효소 공학과 생물 제조 관행에 있어서 AI의 혁신적인 응용 프로그램을 설명합니다. 본 기사는 뤄샤오저우 교수의 발표 내용을 그대로 옮겨 적은 것입니다.

전체 보고서 보기:https://go.hyper.ai/de1KW

4. ICLR 2025에 선정된 MIT/UC Berkeley/Harvard/Stanford는 생물학적 시퀀스 설계의 병목 현상을 극복하기 위해 DRAKES 알고리즘을 제안했습니다.

MIT/UC 버클리/하버드/스탠포드 등 최고 대학의 팀이 공동으로 혁신적인 알고리즘인 DRAKES를 제안했습니다. 강화 학습 프레임워크를 도입하여 최초로 이산 확산 모델에서 완전히 생성된 궤적의 미분 가능한 보상 역전파를 실현했으며, 시퀀스의 자연스러움을 유지하면서 다운스트림 작업의 성능을 크게 향상시켰습니다. 본 논문은 연구논문을 자세히 해석하고 공유하는 것입니다.

전체 보고서 보기:https://go.hyper.ai/YyEof

인기 백과사전 기사

1. 달-이

2. 상호 정렬 융합 RRF

3. 파레토 전선

4. 대규모 멀티태스크 언어 이해(MMLU)

5. 대조 학습

다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

https://go.hyper.ai/wiki