Meta의 가장 큰 비디오 분할 데이터 세트가 이제 온라인에 공개되었습니다. 이는 유사한 데이터 세트보다 50배 더 큽니다. 별이 9천개나 있어요! Kuaishou 디지털 휴먼 데모는 한 번의 클릭으로 시작됩니다!

AI는 어떻게 정지된 인물 사진에 생명을 불어넣어 미소, 눈 깜박임, 심지어 미묘한 표정까지도 살아 움직이게 만들까? 최근 Kuaishou 팀은 LivePortrait를 오픈 소스로 공개했습니다. 정지된 사진을 업로드하면, 풍부한 표정을 지닌 역동적인 인물 사진으로 변환할 수 있습니다. GitHub에서는 이미 9,000개의 별을 받았습니다.이 튜토리얼은 현재 HyperAI에서 사용할 수 있습니다. 지금 와서 체험해보세요!
라이브포트레이트 튜토리얼 링크:
7월 29일부터 8월 2일까지 hyper.ai 공식 웹사이트가 업데이트되었습니다.
* 고품질 공개 데이터 세트: 11개
* 고품질 튜토리얼 선택: 3개
* 커뮤니티 기사 선정: 4개 기사
* 인기 백과사전 항목: 5개
* 8월 마감일 상위 컨퍼런스: 4
공식 웹사이트를 방문하세요:하이퍼.AI
선택된 공개 데이터 세트
SA-V 데이터 세트는 Meta가 2024년에 Meta Segment Anything Model 2의 학습 및 평가를 위해 구축한 대규모 비디오 분할 데이터 세트입니다. 이 데이터 세트에는 약 51,000개의 실제 비디오와 643K개의 시공간 마스크 주석이 포함되어 있으며, 이는 다른 유사한 데이터 세트보다 약 50배 더 큽니다.
직접 사용:https://go.hyper.ai/X4DGI
2. LAB Bench Biology 벤치마크 데이터 세트: 8개 주요 과제와 2.4K개 이상의 객관식 문제 포함
생물학 분야에서 AI 시스템의 효과적인 개발을 촉진하기 위해 FutureHouse Inc.의 연구진은 문헌 검색 및 추론, 그래프 해석, DNA 및 단백질 서열의 이해 및 처리와 같은 실제 생물학 연구에서 AI 시스템의 성능을 평가하는 데 사용되는 언어 에이전트 생물학 벤치마크 데이터세트 LAB-Bench를 출시했습니다. 해당 결과는 최고 학술대회인 NeurlPS 2024에 제출되었습니다.
직접 사용:https://go.hyper.ai/UznkS
3. NuminaMath-CoT 수학 경시대회 문제 데이터셋
이 데이터 세트에는 86만 개 이상의 수학 경연 대회 문제-해결책 쌍이 포함되어 있으며, 각 쌍은 CoT(Chain of Thought) 추론 템플릿을 사용합니다. 데이터 세트의 출처에는 중국 고등학교 수학 연습문제, 미국 및 국제 수학 올림피아드 대회 문제가 포함됩니다. 데이터는 주로 온라인 시험지 PDF와 수학 토론 포럼에서 수집되었습니다.
직접 사용:https://go.hyper.ai/svElx
이 데이터 세트에는 모바일 게임 앱 TapTap의 약 300개 게임에 대한 레이블이 지정된 리뷰가 포함되어 있으며, 총 4,888개의 데이터 예시가 있어 감정 분석 작업에 사용할 수 있습니다. 그 중 3점 미만(최대 5점)의 사용자 리뷰는 0점(불만족)으로, 그 외는 1점(만족)으로 평가하였습니다. 두 범주의 비율은 약 1:1입니다.
직접 사용:https://go.hyper.ai/ISf7c
5. CCPD 데이터 세트 중국 차량 번호판 감지 데이터 세트
CCPD 데이터 세트는 방대하고 다양하며 주의 깊게 주석이 달린 차량 번호판 인식 데이터 세트입니다. 이 데이터 세트는 주로 중국 허페이의 주차장에서 수집되었으며, 흐릿함, 기울어짐, 비오는 날, 눈오는 날 등 다양하고 복잡한 환경에서 촬영한 차량 번호판 사진이 포함되어 있어 차량 번호판 인식 작업에 더 어려움을 겪습니다.
직접 사용:https://go.hyper.ai/gZ37Y
6. TinyStories 단편 소설 합성 데이터 세트
이 데이터 세트는 GPT-3.5와 GPT-4에서 생성한 단편 소설의 합성 데이터 세트이며, 포함된 어휘는 3~4세 어린이의 이해 범위로 제한됩니다. 이 데이터 세트는 유창하고, 일관성 있고, 다양하며, 문법이 거의 완벽한 단편 소설을 생성하는 모델을 훈련하는 데 사용할 수 있습니다.
직접 사용:https://go.hyper.ai/m9ouS
이 데이터 세트는 2019년 AI for Mankind와 HPWREN이 공동으로 공개했습니다. 516개의 훈련 이미지, 147개의 검증 이미지, 74개의 테스트 이미지를 포함하여 총 737개의 이미지가 포함되어 있으며, 주석 형식은 COCO입니다. 구름/안개와 연기를 구별하는 모델의 능력을 개선하고 종단 간 피드백 루프를 구축하는 것을 목표로 합니다.
직접 사용:https://go.hyper.ai/ofGHZ
이는 한 명의 화자가 7권의 논픽션 책에서 발췌한 내용을 읽는 13,100개의 짧은 오디오 클립으로 구성된 퍼블릭 도메인 음성 데이터 세트입니다. 각 단편에 대한 필사본이 제공됩니다. 클립의 길이는 1초에서 10초까지이고, 총 길이는 약 24시간입니다.
직접 사용:https://go.hyper.ai/Eo1bK
이 데이터 세트에는 중국 12지신의 12가지 범주에 대한 8,508개의 이미지가 포함되어 있습니다. 데이터 세트는 85:7.5:7.5의 비율로 훈련, 검증, 테스트로 미리 분할되었습니다.
직접 사용:https://go.hyper.ai/ps2es
10. DISC-Law-SFT 고품질 중국 법률 감독 미세 조정 데이터 세트
이 데이터 세트는 약 30만 개의 훈련 데이터를 포함하고 있으며 중국 법률 분야를 위해 특별히 설계되었습니다. 이 연구의 목적은 사법 분야에서 법률 텍스트 처리, 법적 추론 사고, 지식 검색 및 준수 측면에서 모델의 역량을 개선하는 것입니다.
직접 사용:https://go.hyper.ai/zh9Ij
11. 무료 음성 숫자 데이터 세트(FSDD) 디지털 인식 오디오 데이터 세트
FSDD(Free Spoken Digit Dataset)는 8kHz 샘플링 레이트의 wav 파일 형식의 디지털 음성 녹음으로 구성된 오디오 데이터 세트입니다. 녹음은 시작과 끝 부분의 침묵을 최소화하도록 편집되었습니다.
직접 사용:https://go.hyper.ai/HZ00d
더 많은 공개 데이터 세트를 보려면 다음을 방문하세요.
선택된 공개 튜토리얼
HiDiffusion은 Megvii Technology가 개발한 오픈소스 고해상도 프레임워크로, 텍스트 생성 이미지와 이미지 생성 이미지를 지원할 뿐만 아니라 이미지 복원 기능도 갖추고 있습니다. HyperAI Super Neural은 이제 "HiDiffusion을 사용하여 고품질 8K 이미지를 빠르게 생성하는 데모" 튜토리얼을 출시했습니다. 어떤 명령도 입력할 필요 없이, 클릭 한 번으로 복제하여 시작하세요.
온라인으로 실행:https://go.hyper.ai/yZ5K5
2. LivePortrait Kuaishou 오픈 소스 이미지 생성 비디오 디지털 인간 데모
LivePortrait는 인물 사진 비디오 생성 프레임워크입니다. LivePortrait의 주요 기능으로는 단일 이미지에서 생생한 애니메이션을 생성하고, 눈과 입술의 움직임을 정밀하게 제어하고, 여러 인물 사진을 원활하게 스티칭하고, 다양한 스타일의 인물 사진을 지원하고, 고해상도 애니메이션을 생성하는 것 등이 있습니다. 이 튜토리얼은 LivePortrait의 원클릭 실행 데모입니다. 관련 환경과 종속성이 설치되었습니다. 한 번의 클릭으로 복제하고 시작하여 체험해 볼 수 있습니다.
온라인으로 실행:https://go.hyper.ai/oTs66
3. AuraSR GAN 기반 초고해상도 이미지 확대 데모
AuraSR은 딥러닝을 기반으로 한 고화질 이미지 복원 모델입니다. 이 기능은 이미지 속의 세부 정보를 지능적으로 식별하고 이미지를 확대하는 동안 누락된 세부 정보를 자동으로 보완합니다. AuraSR은 기존의 이미지 확대 방법과 비교해 더 나은 결과를 낼 뿐만 아니라, 사용하기 쉽고 전문적인 기술 없이도 쉽게 사용할 수 있습니다. 한 번의 클릭으로 모델을 복제해 보세요.
온라인으로 실행:https://go.hyper.ai/y2wIU
커뮤니티 기사
1. 메타, 도쿄일렉트론, FPT소프트웨어 등의 기여로 Aitomatic은 반도체 업계 최초로 오픈소스 모델을 출시하며 기업의 기술적 자율성을 '잠금'
산업 분야의 AI 혁신을 선도하는 기업인 Aitomatic은 반도체 산업을 위해 특별히 설계된 세계 최초의 오픈 소스 AI 대규모 언어 모델인 SemiKong 출시를 발표했습니다. 이 회사는 이전에 aiKO라는 AI 에이전트를 출시한 적이 있습니다. 이 에이전트는 기업 사용자의 전문 지식과 데이터를 기반으로 전담 에이전트를 구축하고, 기업에 에이전트에 대한 "완전한 소유권"을 부여합니다.
전체 보고서 보기:https://go.hyper.ai/A7eCi
7월 30일 이른 아침, 제51회 SIGGRAPH 그래픽 컨퍼런스에서 엔비디아 창립자 겸 CEO인 황런쉰과 메타 창립자 겸 CEO인 마크 주커버그가 "난로변 담화"를 나누었습니다. HyperAI는 영상의 하이라이트와 완전한 중국어 자막을 편집했습니다.
전체 보고서 보기:https://go.hyper.ai/rbU2u
3. ICML에 선정되었습니다! MIT팀, AlphaFold 기반으로 단백질의 역동적 다양성 밝혀내며 새로운 돌파구 마련
MIT 연구팀은 AlphaFold와 ESMFold와 같은 정확도가 높은 단일 상태 예측 변수를 재활용하고 맞춤형 흐름 매칭 프레임워크에서 미세 조정하여 AlphaFLOW와 ESMFLOW라는 시퀀스 조건부 단백질 구조 생성 모델을 얻었습니다. 본 논문은 관련 논문에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/qupG9
4. 수준은 고위 병리학자 수준과 거의 같습니다! 청화대 연구팀은 신경교종의 정확한 진단을 달성하기 위해 AI 기반 모델 ROAM을 제안했습니다.
청화대학교 자동화학과 생명기본모델 연구실은 중남대학교 샹야병원과 협력하여 대규모 지역적 관심사와 피라미드형 트랜스포머를 기반으로 한 정밀 병리진단 AI 기본모델 ROAM을 제안했습니다. 이는 임상 수준의 진단과 신경교종의 분자 마커 발견에 사용되며, 다른 유형의 종양에 대한 병리진단으로 확장될 수 있습니다.
전체 보고서 보기:https://go.hyper.ai/w4tsr
인기 백과사전 기사
1. 신경 복사장(NeRF)
2. 그룹 질의 주의 GQA
3. 데이터 증강
4. 대규모 멀티태스크 언어 이해(MMLU)
5. 장기 단기 기억
다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event
위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!
다음주에 뵙겠습니다!
HyperAI 소개
HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.
* 1300개 이상의 공공 데이터 세트에 대한 국내 가속 다운로드 노드 제공
* 400개 이상의 고전적이고 인기 있는 온라인 튜토리얼 포함
* 100개 이상의 AI4Science 논문 사례 해석
* 500개 이상의 관련 용어 검색 지원
* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅
학습 여정을 시작하려면 공식 웹사이트를 방문하세요.