한 장의 카드로 A6000을 사용하여 한 번의 클릭으로 AlphaFold3를 시작하는 방법에 대한 튜토리얼이 이제 온라인에 공개되었습니다! 7만 개 이상의 비디오와 50개의 물리적 객체를 포함하는 360도 모션 캡처 데이터 세트가 공개되었습니다.

지난주, HyperAl은 AlphaFold3 종속성 데이터베이스를 업데이트했지만, 많은 친구들이 데이터가 너무 커서 배포하기 어렵다고 보고했습니다.
이번 주에는hyper.ai 공식 홈페이지에서 "알파폴드3 단백질 예측 데모"가 출시되었습니다.관련 데이터와 모델이 설치 및 구성되어 개인 저장소의 300MB 미만을 차지하며, AlphaFold3를 신속하게 배포하고 사용하여 단백질을 예측하는 데 필요한 것은 단 하나의 A6000 카드뿐입니다.
온라인 사용:https://go.hyper.ai/KHIRR
12월 16일부터 12월 20일까지 hyper.ai 공식 웹사이트가 업데이트되었습니다.
* 고품질 공개 데이터 세트: 10
* 고품질 튜토리얼 선택: 3개
* 커뮤니티 기사 선정: 4개 기사
* 인기 백과사전 항목: 5개
* 1월에 마감일이 있는 주요 컨퍼런스: 9개
공식 웹사이트를 방문하세요:하이퍼.AI
선택된 공개 데이터 세트
데이터 세트는 각 드론 주변에 주석이 달린 경계 상자가 있는 10,000개가 넘는 드론 이미지로 구성되어 있습니다. 경계 상자는 다양한 배경과 환경에서 드론을 감지하고 추적하기 위한 정확한 위치 정보를 제공합니다. 이 데이터 세트는 특히 감시, 드론 감지, 자율 추적과 같은 응용 분야에서 객체 감지 작업을 위한 컴퓨터 비전 모델을 훈련하고 평가하는 데 적합합니다.
직접 사용:https://go.hyper.ai/686JV

2. 360Motion-Dataset 모션 캡처 데이터세트
이 데이터 세트의 V1 버전에는 다양한 동물 등 50개의 서로 다른 개체를 다루는 72,000개의 비디오와 1개의 사막 장면과 2개의 HDRI 장면을 포함한 6개의 Unreal Engine(UE) 장면이 포함되어 있습니다. 또한, 이 데이터 세트에는 121개의 다양한 궤적 템플릿이 포함되어 있어 연구자들에게 풍부한 움직임 패턴과 행동 변화를 제공합니다.
직접 사용:https://go.hyper.ai/rsmeQ

이 데이터 세트는 다양한 모델을 사용하여 뇌종양을 분류하고 세분화하는 데 사용됩니다. 여기에는 1,621개의 신경교종 이미지, 1,775개의 수막종 이미지, 1,757개의 뇌하수체 이미지, 2,000개의 종양이 없는(건강한 뇌) 이미지를 포함하여 총 7,153개의 이미지가 포함되어 있습니다.
직접 사용:https://go.hyper.ai/zgX7A

4. LAION-SG 대규모 고품질 이미지 이해 데이터 세트
LAION-SG에는 객체, 속성, 관계 주석이 포함된 540,005개의 장면 그래프-이미지 쌍이 포함되어 있으며, 이는 훈련, 검증, 테스트 세트로 구분됩니다. 데이터 세트의 이미지는 LAION-Aesthetics V2(6.5+) 데이터 세트에서 나왔으며, 주석 처리 과정에서는 자동 주석 처리를 위해 GPT-4o를 사용합니다.
직접 사용:https://go.hyper.ai/HHT6V

이 데이터 세트에는 긴팔, 칼라, 줄무늬 패턴 등 26가지 기본 의류 속성을 갖춘 1,856개의 이미지가 포함되어 있습니다. 라벨은 Amazon Mechanical Turk를 사용하여 수집되었습니다.
직접 사용:https://go.hyper.ai/7f3ej

이 데이터 세트에는 실제 얼굴과 AI가 생성한 합성 얼굴의 고품질 이미지 3,203개가 포함되어 있으며, 그 중 2,202개가 실제 이미지이고 1,001개가 AI가 생성한 이미지입니다. 이 데이터 세트는 머신 러닝과 딥 러닝 애플리케이션을 위해 설계되었습니다. 실제 얼굴과 AI가 생성한 얼굴을 구별할 수 있는 얼굴 이미지 리소스를 제공하는 것을 목표로 합니다. 딥페이크 감지, 이미지 진위 검증, 얼굴 이미지 분석 등의 작업에 적합하며 최첨단 연구와 응용 프로그램을 지원할 수 있습니다.
직접 사용:https://go.hyper.ai/SwMXL

이 데이터 세트에는 실제 교육 자료에서 파생된 1.1k개의 미공개 대학 수준 수학 문제가 포함되어 있으며, 초등 수학, 대수학, 미분학, 적분학, 다변수 미적분학, 수열과 급수라는 6가지 핵심 수학 주제를 다룹니다.
직접 사용:https://go.hyper.ai/FcNc2
8. Open01-SFT 지도 학습 미세 조정 데이터 세트
OpenO1-SFT 데이터 세트는 지도 미세 조정(SFT) 방법을 사용하여 언어 모델의 사고 연쇄 능력을 활성화하는 데 중점을 둔 데이터 세트로, 모델의 일관된 논리적 추론 시퀀스 생성 능력을 향상시키는 것을 목표로 합니다. 이 데이터 세트에는 중국어뿐만 아니라 영어도 포함하는 77,685개의 레코드가 포함되어 있어 다국어 환경에서 유용합니다.
직접 사용:https://go.hyper.ai/KlyzY
9. QwQ-LongCoT-130K 미세 조정 데이터 세트
QwQ-LongCoT-130K 데이터 세트는 O1과 같은 대규모 언어 모델(LLM)을 훈련하기 위해 설계된 SFT(Supervised Fine-Tuning) 데이터 세트입니다. 이 데이터 세트에는 약 130,000개의 인스턴스가 포함되어 있으며, 각각은 QwQ-32B-Preview 모델을 사용하여 생성된 응답입니다.
직접 사용:https://go.hyper.ai/kE9aG
데이터 세트는 "머신 러닝과 헬스케어"라는 검색어를 사용하여 Google Patents에서 수집되었으며, 의료 영상, 진단 도구부터 AI 기반 치료 권장 사항까지 다양한 분야에서 부여된 특허가 포함되어 있습니다.
직접 사용:https://go.hyper.ai/8p1M5
선택된 공개 튜토리얼
AlphaFold3는 Google DeepMind가 2024년에 개발한 인공지능(AI) 도구입니다. AlphaFold 3 모델은 단백질 구조를 예측할 수 있을 뿐만 아니라 핵산, 소분자, 이온, 변형 잔류물을 포함한 복합체의 구조도 정확하게 예측할 수 있는 확산 기반 아키텍처를 사용합니다.
이 튜토리얼에서는 AlphaFold3를 빠르게 배포하고 사용하여 단백질을 예측하는 방법을 소개합니다. 이 경험을 실행하려면 A6000 카드 하나만 있으면 됩니다.
온라인으로 실행:https://go.hyper.ai/KHIRR

RMBG-2.0은 다양한 카테고리와 이미지 유형에서 전경과 배경을 효과적으로 분리하도록 설계된 오픈 소스 배경 빼기 모델입니다.
모델은 환경과 종속성을 구성했습니다. API 주소를 입력하시면 원클릭 이미지 자르기를 체험하실 수 있습니다.
온라인으로 실행:https://go.hyper.ai/FF10L

3. DePLM: 잡음 제거 언어 모델을 이용한 단백질 최적화(소규모 샘플)
DePLM(노이즈 제거 단백질 언어 모델)은 단백질 언어 모델이 포착한 진화적 정보를 최적화된 대상 속성에 관련성 있는 정보와 관련성 없는 정보가 혼합된 것으로 처리할 수 있으며, 관련성 없는 정보는 "노이즈"로 간주하여 제거함으로써 단백질 적응 환경을 예측하는 모델의 정확도를 높이고 최적화를 위한 기능적으로 최적의 시퀀스를 식별하는 데 도움이 됩니다.
이 튜토리얼은 저장대학교에서 발표한 Denoising Protein Language Model(DePLM)의 학습과 추론에 관한 것입니다. 관련 결과는 "NeurIPS 24"에 선택되었습니다. 플랫폼은 필요한 환경과 데이터 세트를 구성했습니다. 튜토리얼에서 제공하는 명령을 직접 실행하여 학습과 추론을 수행할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/ktd87
또한, 우리는 안정적 확산 튜토리얼 교환 그룹도 만들었습니다. 친구들을 환영합니다. QR 코드를 스캔하고 [SD 튜토리얼]에 댓글을 남겨 그룹에 가입하여 다양한 기술 문제를 논의하고 신청 결과를 공유하세요~

커뮤니티 기사
1. 투유유의 영감을 받아 미국 AI 제약회사의 첫 번째 후보물질이 임상실험에 돌입, 5년간 8차례의 자금조달을 받았다.
최근 미국 AI 제약 스타트업인 엔베다(Enveda)는 1억 3,000만 달러 규모의 시리즈 C 자금 조달을 완료했다고 발표했으며, 이로써 총 자금 조달 규모는 3억 6,000만 달러에 달했습니다. 또한, 올해 10월 말에는 엔베다 플랫폼을 이용해 발굴된 첫 번째 약물 후보물질인 ENV-294가 미국 FDA로부터 IND 승인을 받고 임상 1상 단계에 돌입했습니다. 본 기사는 기업에 대한 자세한 보고서입니다.
전체 보고서 보기:https://go.hyper.ai/rMk2U
2. 청해-티베트 고원의 데이터 부족 문제를 해결하세요! 저장대학교 연구팀은 청해-티베트 고원의 표면 열 흐름 분포를 설명하기 위해 새로운 GeoAI 모델을 제안했습니다.
청장고원의 특수한 지리적 위치로 인해, 일부 험준한 지역의 표면 열 흐름 데이터는 매우 부족합니다. 이러한 문제를 해결하기 위해 저장대학교 지구과학부는 해석성이 향상된 지리적 신경망 가중 회귀 모형을 제안했습니다. 이는 청장고원의 열 흐름 분포와 지구역학적 메커니즘을 종합적으로 이해하기 위한 새로운 연구 프레임워크와 기술 지원을 제공합니다. 본 논문은 논문에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/vqQDi
Meet AI4S의 다섯 번째 라이브 방송에서 저장대학교 지식엔진 연구실 박사과정생인 왕쩌위안은 NeurlPS 2024에 선정된 성과를 공유하고 데모를 시연했습니다. 그는 또한 자신의 제출 경험을 소개했습니다. 실용적인 정보가 가득하니, 클릭해서 빠르게 시청해보세요.
전체 보고서 보기:https://go.hyper.ai/PLyBo
4. DeepMind와 Google Research는 다양한 기술 경로를 사용하여 AI 기상 예보를 위한 "육각형 전사"를 만들기 위해 협력합니다.
구글의 딥마인드와 구글 리서치는 단기, 중기, 장기 예측을 고려하고, 기존 방법과 AI를 통합하여 점진적으로 날씨 예측을 위한 "육각형 전사"를 구축하면서 날씨 예측 분야에서 많은 결과를 발표했습니다.
전체 보고서 보기:https://go.hyper.ai/Cvzkc
인기 백과사전 기사
1. 상호 정렬 융합 RRF
2. 마스크드 언어 모델링(MLM)
3. 핵 규범
4. 콜모고로프-아놀드 표현 정리
5. 데이터 증강
다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event
위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!