Command Palette
Search for a command to run...
데이비드 베이커의 팀은 중요한 업데이트를 발표했습니다. RFantibody는 특정 표적에 대한 맞춤형 항체를 개발할 수 있게 해주고, VisualOverload는 시각적 이해의 경계를 넓혀 복잡한 장면 추론에서 새로운 혁신을 주도합니다.

항체는 현재 단백질 치료제의 핵심입니다. 전 세계적으로 160개 이상의 항체 약물이 시판 승인을 받았으며, 향후 5년간 시장 규모는 4,450억 달러에 이를 것으로 예상됩니다.그러나 치료용 항체의 개발은 여전히 주로 동물 면역이나 대규모 항체 라이브러리에서 후보 분자를 선별하는 데 의존하고 있습니다.이러한 방법은 시간이 많이 걸리고 노동 집약적일 뿐만 아니라, 표적의 특정 에피토프와 일치하는 새로운 항체를 정확하게 설계하는 것을 어렵게 만드는 경우가 많습니다.
이를 바탕으로,데이비드 베이커의 팀은 RFdiffusion을 기반으로 정밀하게 최적화된 차세대 항체 및 나노항체 설계 도구인 RFantibody를 출시했습니다.연구자와 생명공학 엔지니어에게 효율적인 신규 설계 방법을 제공하도록 설계된 이 도구는 딥러닝을 사용하여 항체 구조(특히 CDR 영역)를 생성한 다음 ProteinMPNN을 사용하여 시퀀스를 설계하고 RF2(RoseTTAFold2)를 사용하여 예상 구조로 접히는지 확인합니다.
RFantibody는 효율적인 단백질 설계 도구로서 생물의학 연구, 약물 개발, 백신 설계 및 기타 분야에서 널리 사용되어 생물의학 연구를 위한 새로운 도구를 제공합니다.
HyperAI 공식 웹사이트에서 "RFantibody: 항체 및 나노바디 설계 도구"를 출시했습니다. 지금 바로 사용해 보세요!
온라인 사용:https://go.hyper.ai/sO07A
9월 15일부터 9월 19일까지 hyper.ai 공식 웹사이트 업데이트에 대한 간략한 개요를 소개합니다.
* 고품질 공개 데이터 세트: 10
* 엄선된 고품질 튜토리얼: 7개
* 이번 주 추천 논문 : 5
* 커뮤니티 기사 해석 : 5개 기사
* 인기 백과사전 항목: 5개
* 9월 마감일 상위 컨퍼런스: 1
공식 웹사이트를 방문하세요:하이퍼.AI
선택된 공개 데이터 세트
1. 건설 현장 건설 현장 이미지 데이터 세트
ConstructionSite는 건설 현장 시나리오를 위한 다중 모드 벤치마크 데이터셋으로, 건설 안전 환경에서 비전 언어 모델의 이미지 이해 및 추론 능력을 평가하고 개선하도록 설계되었습니다. 이 데이터셋은 복잡한 장면과 다양한 주석을 포함하고 있으며, 실제 건설 안전 검사와 유사합니다. 이미지 캡션, 시각적 질의응답, 객체 감지, 시각적 위치 추정 및 다중 모드 추론과 같은 작업에 적합합니다.
직접 사용: https://go.hyper.ai/ZRy12
2. HTSC-2025 대기압 고온 초전도체 벤치마크 데이터 세트
HTSC-2025는 상압 고온 초전도체의 임계 온도를 예측하기 위한 벤치마크 데이터셋입니다. 이 데이터셋은 모델에 대한 표준화되고 비교 가능한 시험 샘플을 제공하여 초전도체 예측의 발전과 검증을 촉진하는 것을 목표로 합니다. 이 데이터셋은 약 140개의 재료를 포함하고 있으며, JSON/Parquet 형식으로 저장되어 있어 쉽게 처리할 수 있습니다.
직접 사용: https://go.hyper.ai/G2bJB
3. VisualOverload 장면 이미지 이해 데이터 세트
VisualOverload는 장면 이미지 이해도를 평가하는 데이터셋으로, 외부 지식에 의존하지 않고 복잡한 장면의 세부 사항을 시각적으로 이해하고 추론하는 모델의 능력을 테스트하도록 설계되었습니다. 이 데이터셋은 고해상도 퍼블릭 도메인 그림으로 구성된 2,720개의 질의응답 쌍을 포함하고 있으며, 이러한 그림들은 종종 여러 등장인물, 행동, 하위 플롯, 그리고 복잡한 배경을 특징으로 합니다.
직접 사용: https://go.hyper.ai/Acce1

4. WebExplorer-QA 정보 검색 질의응답 데이터세트
WebExplorer-QA는 정보 검색 및 웹 브라우징 작업을 위한 데이터셋입니다. 복잡한 다단계 추론 및 장거리 웹 탐색에서 까다로운 질의-답변 쌍을 체계적으로 생성하여 모델 성능을 향상시키는 것을 목표로 합니다. 정보 검색, 멀티홉/복잡한 상황 추론, 장문 프롬프트 처리, 도구 호출 및 웹 탐색을 위한 네트워크 에이전트 또는 대규모 언어 모델의 학습 및 평가에 적합합니다.
직접 사용:https://go.hyper.ai/I58Ry
5. AnonyRAG 고전 소설 질의응답 데이터 세트
AnonyRAG는 텐센트 유투랩, 모나쉬 대학교, 홍콩이공대학교에서 공개한 개체 익명화 작업을 위한 질의응답 데이터셋입니다. 이 데이터셋은 개체가 익명화된 경우, 검색 증강 생성(RAG) 시스템이 검색을 통해 증거를 확보하는지 평가하는 것을 목표로 합니다.
직접 사용: https://go.hyper.ai/jzqD9
6. RxnBench 유기화학 질의응답 데이터세트
RxnBench는 다중 모드 화학 반응 이미지 이해를 위한 시각적 질의응답 데이터셋입니다. 화학 반응 이미지 이해, 다중 모드 추론, 과학적 질의응답과 같은 과제에 대한 시각 언어 모델의 역량을 평가하는 것을 목표로 합니다. 이 데이터셋은 유기 화학 반응 이해에 관한 1,525개의 객관식 문제를 포함하고 있으며, 중국어와 영어로 제공됩니다.
직접 사용: https://go.hyper.ai/Utkdo
7. SceneSplat-7K 실내 장면 3D 렌더링 데이터 세트
SceneSplat-7은 실내 장면에 대한 가장 크고 고품질의 3D 가우시안 스플랫(3DGS) 데이터셋입니다. 실제 실내 3D 장면에 대한 시각 언어 사전 학습 모델의 이해 및 의미 추론 능력을 향상시키는 것을 목표로 합니다.
직접 접속: https://go.hyper.ai/HISAa
8. SSTQA 반구조화 표형 질문 답변 데이터 세트
SSTQA는 상하이 교통대학교가 사이먼 프레이저 대학교, 칭화대학교 및 기타 기관들과 협력하여 발표한 반구조화 테이블 질의응답 과제를 위한 벤치마크 데이터셋입니다. 이 데이터셋은 실제 테이블의 복잡한 레이아웃(예: 병합된 셀, 계층적 헤더, 다단계 중첩 등)에 직면했을 때 대규모 언어 모델 및 테이블 질의응답 시스템의 이해 및 답변 능력을 테스트하는 것을 목표로 합니다.
직접 사용: https://go.hyper.ai/JoZyB
9. OmniSpatial 파노라마 공간 추론 벤치마크 데이터 세트
OmniSpatial은 파노라마 공간 추론을 위한 포괄적이고 까다로운 표준화된 벤치마크 데이터셋으로, 시각-언어 모델의 공간 이해 평가에서 부족한 부분을 메우도록 설계되었습니다. 특히 지능형 내비게이션, 증강/가상 현실, 복잡한 장면 이해와 같은 분야에서 대규모 멀티모달 모델의 공간 추론 능력을 훈련하고 평가하는 데 적합합니다.
직접 사용: https://go.hyper.ai/a6ep8
10. 도시 문제 도시 문제 이미지 데이터 세트
Urban Issues는 자동화 및 머신 비전 시스템이 도시 환경의 공공 인프라 및 환경 문제를 식별할 수 있도록 설계된 공개 이미지 분류 데이터세트입니다. 이 데이터세트의 이미지는 범주별로 정리되어 있으며, 각 이미지는 단일 클래스로 레이블이 지정되어 다양한 배경, 조명 및 시야각 조건에서 표현됩니다.
직접 사용: https://go.hyper.ai/2id2J

선택된 공개 튜토리얼
1. HiDream-E1.1: 명령 기반 이미지 편집기
HiDream-E1.1 모델은 Zhixiang Future에서 출시한 오픈소스 이미지 편집 모델입니다. 자체 Sparse Diffusion Transformer 아키텍처를 기반으로 메가픽셀 해상도를 지원하며 MIT 오픈소스 라이선스를 따릅니다. 이 모델은 "말하고, 바꾸고" 자연어 이미지 편집 기능을 구현합니다. 사용자는 전문적인 소프트웨어 기술 없이도 간단한 언어 명령을 통해 색상 조정, 스타일 변환, 요소 추가 및 삭제와 같은 복잡한 작업을 수행할 수 있습니다.
온라인 실행: https://go.hyper.ai/P9C3R

2. RFantibody: 항체 및 나노바디 설계 도구
RFdiffusion2는 데이비드 베이커 연구팀이 개발한 항체 및 나노바디 설계 도구입니다. 연구자와 생명공학 엔지니어에게 효율적인 드노보(de novo) 설계 접근법을 제공하는 것을 목표로 합니다. 핵심적으로, 이 도구는 딥러닝 기술을 활용하여 구조 정보를 기반으로 항체의 3차원 구조와 아미노산 서열을 예측하고 설계하여 특정 표적을 표적으로 하는 맞춤형 항체 개발을 가능하게 합니다.
온라인 실행: https://go.hyper.ai/sO07A
3. FastVLM: 매우 빠른 시각 언어 모델
FastVLM은 Apple 팀이 개발한 고효율 시각 언어 모델(VLM)입니다. 고해상도 이미지 처리의 효율성과 성능을 향상시킵니다. 이 모델은 새로운 하이브리드 비전 인코더인 FastViTHD를 통합하여 시각적 토큰 수를 효과적으로 줄이고 인코딩 시간을 크게 단축합니다.
온라인 실행: https://go.hyper.ai/xg8wa

4. SEED-X-PPO-7B: 강화학습을 통해 최적화된 다국어 번역 모델
SEED-X-PPO-7B는 ByteDance Seed 팀이 출시한 차세대 다국어 번역 모델입니다. PPO(Proximal Policy Optimization) 강화 학습 알고리즘을 이용한 반복 최적화를 기반으로 하며, 교차 언어 환경에서 고정밀 의미 전달의 필요성을 해결하는 것을 핵심 목표로 합니다. 이 모델은 소수 언어에 적응하고, 문화적 맥락을 복원하며, 장문 텍스트의 일관성을 유지하는 기존 번역 모델의 한계를 극복하여 중국어, 영어, 독일어를 포함한 28개 주요 언어 간의 번역을 지원합니다.
온라인 실행: https://go.hyper.ai/aw5oS

5. SRPO: AI 스타일 이미지 생성에 작별 인사를 고하세요!
SRPO는 텐센트 훈위안(Tencent Hunyuan) 팀, 홍콩 중국대학교 선전(Shenzhen) 이학부, 그리고 칭화대학교 선전 국제대학원이 공동으로 개발한 텍스트-이미지 생성 모델입니다. 보상 신호를 텍스트 조건부 신호로 설계함으로써, 보상의 온라인 조정을 가능하게 하고 오프라인 보상 미세 조정에 대한 의존도를 줄입니다.
온라인 실행: https://go.hyper.ai/8OQxS

6. ERNIE-4.5-21B-A3B-Thinking: 경량 모델 추론 기능 업그레이드
ERNIE-4.5-21B-A3B-Thinking은 바이두 원신 이얀(Baidu Wenxin Yiyan) 팀이 발표한 추론 모델의 경량 "사고 버전"입니다. 이 모델은 전문가 혼합(MoE) 아키텍처를 사용하며, 총 매개변수 크기는 21B이고, 각 토큰은 3B 매개변수를 활성화합니다. 명령어 미세 조정 및 강화 학습을 통해 학습됩니다.
온라인 실행: https://go.hyper.ai/bQmlo

7. RFdiffusion2: 단백질 디자인 도구
RFdiffusion2는 워싱턴 대학교 단백질 설계 연구소에서 발표한 딥러닝 단백질 설계 모델입니다. 이 모델은 간단한 화학 반응 설명을 기반으로 맞춤형 활성 부위를 가진 효소 스캐폴드를 생성할 뿐만 아니라, 촉매 설계의 기존 기술적 병목 현상을 크게 극복하여 플라스틱 분해와 같은 중요한 응용 분야에 강력한 기술 지원을 제공합니다.
온라인 실행: https://go.hyper.ai/9YInD
💡또한, 안정적 확산 튜토리얼 교환 그룹도 만들었습니다. 친구들을 환영합니다. QR 코드를 스캔하고 [SD 튜토리얼]에 댓글을 남겨 그룹에 가입하여 다양한 기술 문제를 논의하고 신청 결과를 공유하세요~

이번 주 논문 추천
1. OmniWorld: 4D 세계 모델링을 위한 다중 도메인 및 다중 모달 데이터 세트
본 논문에서는 4차원 세계 모델링을 위해 설계된 대규모, 다중 도메인, 다중 모달 데이터셋인 OmniWorld를 제시합니다. 이 데이터셋은 새롭게 수집된 OmniWorld-Game 데이터셋과 다양한 응용 시나리오를 포괄하는 여러 공개 데이터셋으로 구성됩니다.
논문 링크: https://go.hyper.ai/SbW2Y
2. WebWeaver: 개방형 심층 연구를 위한 동적 개요를 갖춘 웹 규모 증거 구조화
본 논문은 인간의 연구 과정을 모방하도록 설계된 새로운 이중 에이전트 프레임워크인 WebWeaver를 제안합니다. 계획 에이전트는 동적 루프 방식으로 작동하며, 증거 수집과 개요 수정을 반복적으로 엮어 증거 메모리에 연결된 포괄적이고 출처 기반의 구조화된 개요를 생성합니다. 이후, 작성 에이전트는 계층적 검색 및 작성 프로세스를 실행하여 보고서의 각 섹션을 완성합니다.
논문 링크: https://go.hyper.ai/lqMvM
3. 지속적인 사전 학습을 통한 에이전트 확장
본 논문에서는 최초로 에이전트 연속 사전 학습(Agentic CPT)을 딥러닝 에이전트의 학습 과정에 통합하여 강력한 에이전트 기반 모델을 구축하는 방안을 제안합니다. 연구진은 이 접근법을 기반으로 AgentFounder라는 딥러닝 에이전트 모델을 개발했습니다.
논문 링크: https://go.hyper.ai/6lyWG
4. WebSailor-V2: 합성 데이터와 확장 가능한 강화 학습을 통해 독점 에이전트와의 간극을 메우는 방법
본 논문은 구조화된 샘플링과 정보 퍼지화를 통해 새로운 고불확실성 작업을 생성하는 포괄적인 사후 학습 방법론인 WebSailor를 제안합니다. 이 방법은 RFT 콜드 스타트 전략을 채택하고 이를 고효율 에이전트 기반 강화 학습 학습 알고리즘인 반복 샘플링 정책 최적화(DUPO)와 결합합니다. 이러한 통합 과정을 통해 WebSailor는 복잡한 정보 검색 작업에서 기존의 모든 오픈 소스 에이전트보다 월등히 우수한 성능을 보이며, 독점 에이전트의 성능에 근접하고 성능 격차를 효과적으로 줄입니다.
논문 링크: https://go.hyper.ai/biWLb
5. Hala 기술 보고서: 대규모 아랍어 중심 교육 및 번역 모델 구축
본 논문은 아랍어 중심의 교육 및 번역 모델인 Hala를 제시합니다. Hala는 독자적인 번역 미세 조정 파이프라인을 기반으로 구축되었으며, 핵심 아랍어 벤치마크에서 "나노"(매개변수 20억 개 이하) 및 "소규모"(매개변수 70억~90억 개) 범주 모두에서 최첨단 성능을 달성하여 기존 모델보다 훨씬 우수한 성능을 보여줍니다.
논문 링크: https://go.hyper.ai/KI73S
더 많은 AI 프런티어 논문:https://go.hyper.ai/iSYSZ
커뮤니티 기사 해석
1. IJCAI 2025 | 7개 데이터 세트 검증: scSiameseClu가 비지도 단일 셀 클러스터링 작업에서 SOTA 성능 달성
중국과학원, 동북농업대학교, 마카오대학교, 지린대학교 연구팀은 단일 세포 RNA-seq 데이터 해석을 위한 새로운 트윈 클러스터링 프레임워크인 scSiameseClu를 공동으로 제안했습니다. 이 프레임워크는 표현 붕괴 문제를 효과적으로 완화하고, 더욱 명확한 세포 집단 분류를 달성하며, scRNA-seq 데이터 분석을 위한 강력한 도구를 제공할 수 있습니다.
전체 보고서 보기: https://go.hyper.ai/hyDFA
2. 온라인 튜토리얼 | Tencent Hunyuan-MT-7B, ACL 기계 번역 대회 30개 언어 우승, 33개 언어 지원
2025년 9월, 텐센트 훈위안(Tencent Hunyuan) 팀은 33개 언어와 5개 민족 중국어/방언 간 번역을 지원하는 경량 번역 모델인 훈위안-MT-7B를 출시했습니다. 70억 개의 매개변수만으로 효율적이고 정확한 번역을 구현합니다. 이 모델은 전산언어학회(ACL) WMT2025 경진대회에서 31개 언어 부문 중 30개 부문에서 1위를 차지하며 놀라운 성과를 거두었습니다.
전체 보고서 보기: https://go.hyper.ai/y2X2L
3. 400%로 정확도 향상! 인도 몬순 예측 모델은 36개 기상 관측소를 기반으로 하며, 도시 단위의 상세한 예보를 가능하게 합니다.
최근 몇 년 동안 뭄바이에서는 극심한 강우의 빈도와 강도가 크게 증가했습니다. 기존의 전 세계 예보 시스템은 해상도가 부족하여 지역 기상 패턴을 정확하게 파악하는 데 어려움을 겪고 있습니다. 이 문제를 해결하기 위해 인도 공과대학교(IIT) 봄베이 캠퍼스는 메릴랜드 대학교와 협력하여 합성곱 신경망(CNN)과 전이 학습(Transfer Learning)을 기반으로 한 예측 모델을 개발하여 극심한 강우 현상을 조기에 예측할 수 있도록 했습니다.
전체 보고서 보기: https://go.hyper.ai/wYsSk
DeepSeek-R1 연구 결과는 네이처(Nature) 표지에 실리면서 전 세계 학계에서 뜨거운 논쟁을 불러일으켰습니다. 이 논문이 네이처에 게재된 것은 권위 있는 학술지인 네이처의 동료 심사를 받았다는 점에서 큰 의미가 있습니다.
전체 보고서 보기: https://go.hyper.ai/B12hL
5. 구글 딥마인드는 AI를 사용하여 3개의 유체 방정식에서 새로운 불안정한 특이점을 발견함으로써 밀레니엄상 수상을 위한 노력에서 새로운 진전을 이루었습니다.
Google DeepMind는 뉴욕대학교, 스탠포드대학교, 브라운대학교 및 기타 기관의 연구자들과 협력하여 머신 러닝 프레임워크와 고정밀 가우스-뉴턴 최적화 도구를 기반으로 처음으로 세 가지 다른 유체 방정식에서 새로운 불안정한 특이점을 체계적으로 발견하고, 폭발률을 불안정성 차수와 연결하는 간단한 경험적 점근 공식을 공개했습니다.
전체 보고서 보기: https://go.hyper.ai/hq5og
인기 백과사전 기사
1. 달-이
2. 상호 정렬 융합 RRF
3. 파레토 전선
4. 대규모 멀티태스크 언어 이해(MMLU)
5. 대조 학습
다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event
위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!
다음주에 뵙겠습니다!
HyperAI 소개
HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.
* 1800개 이상의 공개 데이터 세트에 대한 국내 가속 다운로드 노드 제공
* 600개 이상의 고전적이고 인기 있는 온라인 튜토리얼 포함
* 200개 이상의 AI4Science 논문 사례 해석
* 600개 이상의 관련 용어 검색 지원
* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅
학습 여정을 시작하려면 공식 웹사이트를 방문하세요.