10k 스타 오픈소스 데이터 처리 도구가 클릭 한 번으로 출시되었습니다! 176개 언어 인식을 지원합니다. 최초의 고층 건물 낙하물 감지 데이터 세트가 온라인에 공개되었으며, 18개 장면에 걸쳐 약 2,000개의 동영상이 포함되어 있습니다.

인공지능 분야에서 다중 모드 데이터 처리는 항상 어려운 문제였습니다. 여러 형식의 복잡한 PDF, 웹 페이지, 전자책을 접하면 핵심 정보를 효과적으로 추출하기 쉽지 않습니다.
상하이 인공지능 연구소와 OpenDataLab 팀은 오픈 소스 지능형 데이터 추출 도구인 MinerU를 출시했습니다. 이 도구는 이미지, 수식, 표 등의 요소를 포함하는 다중 모드 PDF 문서를 분석하기 쉬운 마크다운 형식으로 변환할 수 있습니다. 또한 웹 페이지와 전자책에서 콘텐츠를 추출하는 기능을 지원하여 복잡한 문서에서 고품질 데이터를 자동으로 추출해야 하는 필요성을 해결합니다.
hyper.ai 공식 웹사이트에서 "MinerU 원스톱 데이터 추출 도구 데모"가 출시되었습니다.아래로 스크롤하여 링크를 받으세요~
8월 26일부터 8월 30일까지 hyper.ai 공식 웹사이트가 업데이트되었습니다.
* 고품질 튜토리얼 선택: 3개
* 고품질 공개 데이터 세트: 10
* 커뮤니티 게시물 선정 : 3개 게시물
* 인기 백과사전 항목: 5개
* 9월 마감일 상위 컨퍼런스: 7개
공식 웹사이트를 방문하세요:하이퍼.AI
선택된 공개 튜토리얼
MinerU는 PDF를 기계가 읽을 수 있는 형식(예: 마크다운, JSON)으로 변환하는 도구로, 모든 형식으로 쉽게 추출할 수 있으며, 176개 언어를 정확하게 인식하고 정밀한 언어 유형 식별을 수행합니다. 모델과 환경이 배포되었습니다. 튜토리얼 지침에 따라 추론 생성을 위해 대형 모델을 사용할 수 있습니다.
직접 사용:https://go.hyper.ai/MIitP
LongWriter는 청화대학교에서 개발한 오픈 소스 프로젝트로, 장문 컨텍스트 대규모 언어 모델(LLM)을 사용하여 매우 긴 텍스트(10,000단어 이상)를 생성합니다. 이 튜토리얼은 모델을 한 번의 클릭으로 배포하는 데모입니다. 컨테이너를 복제하고 시작하고, 생성된 API 주소를 직접 복사하기만 하면 모델의 추론을 경험할 수 있습니다.
직접 사용:https://go.hyper.ai/Xvktt
3. 온라인 튜토리얼 | 청도 소년 교은군의 영혼이 검은 신화: 원숭이 왕으로 여행을 떠난다? MuseV + MuseTalk로 고품질 디지털 휴먼을 만들어 보세요
기존의 디지털 휴먼 훈련 프로그램을 사용하여 고품질의 디지털 휴먼을 생성하려면 많은 시간과 컴퓨팅 리소스가 필요하며, 훈련 자료에 대한 요구 사항도 높습니다. MuseV와 MuseTalk의 등장은 디지털 인간 분야에 새로운 획기적인 진전을 가져왔습니다. MuseV를 사용하여 디지털 인간 비디오를 생성한 후, MuseTalk를 사용하여 입술 움직임과 오디오를 동기화하면 단 몇 분 만에 완전한 디지털 인간 제작이 가능합니다. 이 모든 것은 hyper.ai의 공개 튜토리얼 모듈에 업로드되었으며, 한 번의 클릭으로 복제하여 온라인에서 실행할 수 있습니다!
MuseV 튜토리얼:https://go.hyper.ai/9fExW
MuseTalk 튜토리얼:https://go.hyper.ai/wiw8g
선택된 공개 데이터 세트
FADE 데이터 세트에는 18개 장면, 8가지 낙하물 유형, 4가지 기상 조건, 4가지 비디오 해상도를 다루는 1,881개의 비디오가 포함되어 있습니다. FADE 데이터 세트는 다양성과 전문성을 갖추고 있어 건물 주변에서 낙하물 감지를 연구하는 데 귀중한 자료가 됩니다.
직접 사용:https://go.hyper.ai/8u8Sr
2. ChiPBench Al 칩 레이아웃 알고리즘 데이터 세트
ChiPBench는 기존 AI 기반 칩 배치 알고리즘이 최종 설계 PPA 지표를 개선하는 데 얼마나 효과적인지 평가하기 위해 특별히 설계된 포괄적인 벤치마크입니다. 연구팀은 다양한 분야(CPU, GPU, 마이크로컨트롤러 등)에서 20개의 회로를 수집했습니다. 이러한 설계를 통해 최종 설계 PPA에 대한 배치 알고리즘의 영향을 평가할 수 있습니다.
직접 사용:https://go.hyper.ai/LN4Ab
이 데이터 세트에는 약 9.6k개의 얼굴 이미지가 포함되어 있으며, 그 중 5k개는 실제 얼굴 이미지이고 4.63k개는 AI가 생성한 얼굴 이미지입니다.
직접 사용:https://go.hyper.ai/N5nVT
4. TableBench 테이블 질의응답 벤치마크 데이터세트
이 데이터 세트는 18개 도메인의 886개 샘플을 포함하고 있으며, 사실 확인, 수치적 추론, 데이터 분석 및 시각화 작업을 용이하게 하도록 설계되었습니다.
직접 사용:https://go.hyper.ai/Qcs2F
이 데이터 세트에는 16개의 서로 다른 장면에서 연기하는 28명의 배우가 등장하는 363개 이상의 오리지널 클립이 포함되어 있습니다. 이러한 고품질 비디오는 실제 콘텐츠에 대한 모델 훈련에 대한 견고한 기초를 제공합니다. 원본 데이터 외에도 해당 데이터 세트에는 DeepFakes 방법을 사용하여 생성된 3,000개 이상의 처리된 비디오가 포함되어 있습니다.
직접 사용:https://go.hyper.ai/Jw59B
이 데이터 세트는 차량 분류 작업을 위해 설계되었으며, 7개 카테고리로 구분된 5.6k개의 이미지를 포함하고 있습니다. 각 카테고리는 다양한 유형의 차량(오토 릭샤, 자전거, 자동차, 오토바이, 비행기, 선박, 기차)을 나타내며, 모든 이미지는 .jpg 확장자를 가진 JPEG 형식입니다. 다양한 차량 유형을 구별하기 위한 이미지 분류 모델을 구축하고 테스트하는 데 적합합니다.
직접 사용:https://go.hyper.ai/e9LNg
7. 트랙에서의 감지 트랙에서의 인간 행동 감지 데이터 세트
이 데이터 세트에는 1,080×1,080 해상도의 철도 선로 위의 사람 이미지 3,766개가 포함되어 있습니다. 각 이미지에는 철도 선로에서 사람의 존재와 그들의 행동을 표시하는 경계 상자가 주석으로 달려 있습니다.
직접 사용:https://go.hyper.ai/dsr49
8. Ref-AVS 오디오-비주얼 장면 분할 데이터 세트
Ref-AVS 데이터 세트는 시청각 장면에서 객체 분할 작업을 위한 벤치마크입니다. 이 데이터 세트에는 청각적 물체에 대한 48개의 비디오가 포함되어 있으며, 구체적으로는 악기 20개, 동물 8개, 기계 15개, 인간 5개로 분류됩니다.
직접 사용:https://go.hyper.ai/pGHwm
9. COSMOS 1050K 의료 이미지 분할 데이터 세트
이 데이터 세트에는 연구팀이 수집한 53개의 공공 의료 데이터 세트가 포함되어 있으며, 18개 모달리티, 84개 객체, 1050K 2D 이미지 및 6033개 마스크를 다루고 있습니다.
직접 사용:https://go.hyper.ai/nHETv
10. 14만 개의 이미지가 들어있습니다! HUST-OBC Oracle 데이터 세트, 팀이 ACL 최우수 논문상 수상에 기여
이 데이터 세트는 화중과학기술대학교 바이샹 교수 연구팀의 왕펭지에 등이 제안한 고품질 HUST-OBC 데이터 세트입니다. 이는 책, 웹사이트, 기존 데이터세트를 포함한 3가지 서로 다른 출처에서 수집되었습니다. 이 데이터 세트에는 두 가지 유형의 오라클 뼈 샘플 이미지가 포함되어 있습니다. 하나는 원본 갑골문의 스캔본을 가공하여 얻은 갑골문 이미지이고, 다른 하나는 원본 갑골문을 바탕으로 손으로 쓴 갑골문 이미지입니다. 이는 다시 탁본을 바탕으로 한 이미지와 문자를 바탕으로 한 손으로 쓴 이미지로 나뉩니다.
직접 사용:https://go.hyper.ai/46AiA
더 많은 공개 데이터 세트를 보려면 다음을 방문하세요.
커뮤니티 기사
1. SAM 2 최신 앱이 출시되었습니다! 옥스포드 대학 팀, Medical SAM 2 출시, 의료 영상 분할 SOTA 목록 갱신
옥스퍼드 대학교 연구팀은 Medical SAM 2라는 의료 이미지 분할 모델을 개발했습니다. 이 모델은 SAM 2 프레임워크를 기반으로 설계되었으며 의료 이미지를 비디오로 처리합니다. 이 제품은 3D 의료 영상 분할 작업에서 우수한 성능을 발휘할 뿐만 아니라, 새로운 단일 프롬프트 분할 기능도 제공합니다. 본 논문은 연구논문을 자세히 해석하고 공유하는 것입니다.
전체 보고서 보기:https://go.hyper.ai/04VFX
2. 유전체학을 위한 AI | 공간 전사체 데이터 표현 알고리즘 SPACE, 유전체학에 인공지능 적용
"AI4S를 만나다" 생방송 시리즈의 두 번째 에피소드에서 청화대학교 생명과학대학 장창펑 연구실의 박사후 연구원인 리위저는 "게놈학에서의 AI 응용 탐구: 공간 전사체 데이터 특성화 알고리즘 SPACE를 예로 들어보자"라는 제목으로 팀의 최신 연구 결과를 공유했습니다. 이 기사는 그의 연설을 기록한 것으로, 실질적인 정보가 가득 담겨 있습니다.
전체 보고서 보기:https://go.hyper.ai/eRQeT
3. 상하이 교통대학 홍량 교수: AI가 공학 분야에서 획기적인 발전을 이루고 싶다면, 기존 인간 전문가가 달성할 수 없는 공학적 성과를 달성해야 합니다.
AI 생명공학 여름학교에서 상하이 교통대학교의 홍량 교수는 "AI가 생명과 과학에 진입하다"라는 주제로 과학 연구, 특히 단백질 설계에 AI를 적용하는 방법을 이해하기 쉬운 방식으로 공유했으며, 과학을 위한 AI의 미래 발전에 대한 자신의 전망을 밝혔습니다. 이 기사는 홍량 교수의 연설 중 주요 내용을 요약한 것입니다.
전체 보고서 보기:https://go.hyper.ai/TWBIk
인기 백과사전 기사
1. 달-이
2. 연합을 통한 교차(IoU)
3. 마스크드 언어 모델링(MLM)
4. 신경 복사장(NeRF)
5. 상호 정렬 융합 RRF
다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event
위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!
다음주에 뵙겠습니다!
HyperAI 소개
HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.
* 1300개 이상의 공공 데이터 세트에 대한 국내 가속 다운로드 노드 제공
* 400개 이상의 고전적이고 인기 있는 온라인 튜토리얼 포함
* 100개 이상의 AI4Science 논문 사례 해석
* 500개 이상의 관련 용어 검색 지원
* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅
학습 여정을 시작하려면 공식 웹사이트를 방문하세요.