주간 편집자 추천 | 고향닭 오픈소스 "요리원산지 보고서", 옛 사진 복구 SUPIR 도구 온라인 이용

속보입니다! 속보입니다!노향지의 '비밀문서'가 실제로 공개되었습니다!
최근 라오샹지는 20만 단어 분량의 '라오샹지 식품 추적 보고서'를 대중에 공개했는데, 재료 원산지부터 조리 세부 사항까지 모든 것을 명확하게 기술했습니다. 지금 Chao Shen Wang에서 다운로드할 수 있습니다. 마음에 드는 게 있는지 와서 확인해보세요!
PS: 편집자는 보고서대로 작업이 실패하면 문제를 제기할 수 있는지 묻고 싶어합니다.
4월 15일부터 4월 19일까지 hyper.ai 공식 웹사이트가 업데이트됩니다.
* 고품질 공개 데이터 세트: 10
* 엄선된 고품질 튜토리얼: 2개
* 커뮤니티 게시물 선정 : 3개 게시물
* 인기 백과사전 항목: 5개
공식 웹사이트를 방문하세요:하이퍼.AI
선택된 공개 데이터 세트
1. 수제 닭고기 식품 추적 보고서
이 데이터 세트는 현재 운영 중인 1,218개의 라오샹지 레스토랑, 226개의 SKU, 873개의 재료, 305개의 공급업체를 포함합니다. 라오샹지는 677페이지, 20만 단어로 구성된 "라오샹지 식품 추적 보고서"를 대중에 공개했습니다.
직접 사용:https://go.hyper.ai/nbESl
2. Open Sora Dataset 프로젝트 비디오 데이터셋
Open-Sora-Plan은 OpenAI의 Sora(T2V 모델)를 재현하는 것을 목표로 하는 오픈 소스 프로젝트입니다. 이 데이터 세트는 해당 프로젝트의 비디오 데이터 세트입니다. 연구팀은 CC0 라이선스에 따라 오픈소스 웹사이트에서 40,258개의 비디오를 크롤링했습니다. 모든 영상은 고화질이며 워터마크가 없습니다. 그 중 약 60%는 풍경 데이터입니다.
직접 사용:https://go.hyper.ai/75Ftc
3. MMVP 멀티모달 모션 캡처 데이터 세트
이 데이터 세트에는 달리기, 건너뛰기, 제자리 멀리뛰기 등과 같은 대규모의 빠른 인간 동작이 많이 포함되어 있으며, 16명의 피험자로부터 총 44k개 이상의 프레임 동기화된 RGBD 프레임과 압력 데이터가 수집되었습니다.
직접 사용: https://go.hyper.ai/4edeR
4. OpenWebMath Open Web Mathematics 교육 데이터 세트
OpenWebMath는 인터넷의 대부분에서 수집된 고품질 수학 텍스트를 포함하는 데이터 세트입니다. 이는 Common Crawl에서 2000억 개가 넘는 HTML 파일에서 필터링 및 추출되어 총 147억 개의 토큰을 포함하는 630만 개의 문서 세트가 생성됩니다. OpenWebMath는 대규모 언어 모델의 사전 학습 및 미세 조정을 위해 설계되었습니다.
직접 사용: https://go.hyper.ai/zjytq
5. Proof-Pile-2 수학 데이터 세트
Proof-Pile-2는 550억 개의 수학 및 과학 문서로 구성된 토큰화된 데이터 세트입니다. 2023년 4월 기준의 과학 논문, 수학 관련 웹 콘텐츠 및 수학 코드를 혼합한 것입니다(린 증명 단계의 특정 하위 집합 제외). 이 데이터 세트는 Llemma 7B 및 Llemma 34B 모델을 훈련하기 위해 만들어졌습니다.
직접 사용: https://go.hyper.ai/aant8
6. 미자르 수학 데이터 세트
미자르 수학 라이브러리에는 논리, 대수, 분석, 기하학 등 광범위한 수학 분야를 포괄하는 정형화된 수학적 정리와 증명이 포함되어 있습니다. 이 라이브러리의 목표는 자동화된 정리 증명과 형식적 추론을 위한 견고한 수학적 기반을 제공하는 것입니다.
직접 사용: https://go.hyper.ai/IJeHa
7. 이사벨 패럴렐 코퍼스
Isabelle Parallel Corpus(IPC)는 Isabelle 문서의 병렬 코퍼스를 만드는 커뮤니티 주도 이니셔티브입니다. IPC는 Isabelle의 공식 문서(정리, 보조정리, 정의 등)와 자연어 대응 문서를 연결합니다.
직접 사용: https://go.hyper.ai/BEADY
8. 과일 데이터 세트 과일 신선도 분류 데이터 세트
이 데이터 세트에는 사과, 오렌지, 바나나 등 세 가지 유형의 과일 이미지가 포함되어 있습니다. 각 이미지에는 과일 종류와 신선도 상태에 따라 레이블이 지정되어 분류나 객체 감지와 같은 지도 학습 작업이 가능합니다.
직접 사용:https://go.hyper.ai/b7TNx
9. DeepFruit 과일 이미지 분류 데이터 세트
DeepFruit은 모하메드 빈 파드 대학교와 다른 연구 기관이 공동으로 공개한 과일 이미지 분류 데이터 세트입니다. 이 데이터 세트에는 8가지 다른 과일 세트를 기반으로 한 21,122개의 과일 이미지가 포함되어 있습니다. 과일 감지, 식별 및 분류 분야의 연구는 물론 칼로리 추정과 같은 혁신적인 응용 분야에도 활용될 수 있습니다.
직접 사용:https://go.hyper.ai/ut4BA
10. 15 동물 이미지 분류 데이터 세트
이 데이터 세트에는 15가지 동물의 이미지 폴더가 포함되어 있으며, 모든 이미지의 크기는 224X224로 이미지 분류에 적합합니다. 이미지는 인터넷에서 다운로드한 후 OpenCV 라이브러리를 사용하여 사전 처리(크기 조절 및 향상)되었습니다. 따라서 이 데이터 세트는 추가적인 데이터 증강 없이 학습에 직접 사용될 수 있습니다.
직접 사용:https://go.hyper.ai/tgMtH
더 많은 공개 데이터 세트를 보려면 방문하세요.:
선택된 공개 튜토리얼
1. 온라인 튜토리얼 | 낮은 임계값 배포! SUPIR은 모든 종류의 흐릿한 이미지를 해결하는 데 특화되어 있으며 미세 조정을 위해 텍스트 설명도 이해할 수 있습니다.
이미지 복원 도구 SUPIR은 StableDiffusion-XL(SDXL)과 모델 확장 기술을 사용하며, 머신 러닝과 멀티모달 방식을 통해 이미지 복원 품질을 크게 향상시킬 수 있습니다. 이 튜토리얼은 모든 사람을 위한 환경을 구축했습니다. 복잡한 사전 준비 없이, 클릭 한 번으로 이미지를 복구할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/3RBMH
2. Ollama 및 Open WebUI를 사용하여 대규모 모델 배포
이 튜토리얼은 Ollama + Open WebUI의 원클릭 실행 패키지입니다. 대규모 모델을 실행하려면 단계를 따르고 명령을 입력하기만 하면 됩니다. 현재 포함된 모델은 qwen 1.5 14b, qwen 1.5 32b, llava 1.6 34b이며, 새로운 모델을 직접 업로드할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/FwREK
커뮤니티 기사
1. 상하이 교통대학교 허율리안 연구팀, AutoML 기반으로 지식 자동 추출, 촉매 설계 가속화
상하이 교통대학교 공동연구소의 유리안 허 조교수가 이끄는 연구 그룹은 Eads를 결정하는 주요 물리량을 결정하는 새로운 방법, 즉 자동 기계 학습을 기반으로 한 특징 삭제 실험을 제안했는데, 이를 통해 고처리량 밀도 함수 이론 데이터베이스에서 자동으로 지식을 추출할 수 있었습니다. 이 글은 연구에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/LEVS1
2. 구글 홍수 예측 모델, 세계 1위 시스템 제치고 네이처에 다시 게재…80개국 이상 포함
Google 팀은 머신 러닝을 기반으로 강 예측 모델을 개발했습니다. 이 모델의 예측 능력은 세계에서 가장 진보된 홍수 예측 시스템인 GloFAS보다 뛰어납니다. 이 제품은 5일 전에 정확한 홍수 예보를 내릴 수 있으며, 80개국 이상을 커버합니다. 본 논문은 연구 결과를 공유하고 해석한 것입니다.
전체 기사 보기:https://go.hyper.ai/V4r4i
상하이 교통대학교 연구팀은 리튬 배터리의 전체 수명 주기 동안 생성되는 저렴하고 풍부한 비표시 데이터를 최대한 활용하는 반지도 학습 방법인 PBCT를 제안했습니다. 숨겨진 정보를 추출함으로써 기본 데이터 패턴에 대한 이해를 심화시키고 20%에 따른 리튬 배터리 수명 예측의 정확도를 향상시킵니다. 본 논문은 연구 결과를 공유하고 해석한 것입니다.
전체 보고서 보기:https://go.hyper.ai/2EQGa
인기 백과사전 기사
1. 시대
2. 학습률
3. 대응 t-검정
4. 확산 모델
5. 대규모 언어 모델
다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.
B 스테이션 생방송 미리보기
Google은 최근 2024년 5월 14일에 2024 I/O 개발자 컨퍼런스를 개최한다고 발표했습니다. 모든 사람이 Google에 대해 더 깊이 이해할 수 있도록 돕기 위해슈퍼신경 라이브 방송실이다음 주 월요일부터 "구글 스페셜" 영상을 24시간 내내 생중계합니다.내용: 지난 몇 년간의 Google I/O 기자 회견, 임원 인터뷰, 관련 다큐멘터리 및 기타 풍부한 콘텐츠.
다음 표는 편집자가 선택한 콘텐츠의 미리보기입니다↓↓↓
날짜 | 시간 | 콘텐츠 |
4월 15일 월요일 | 18:00 | Google I/O 컨퍼런스 연도별 현황 |
4월 16일 화요일 | 18:00 | Google Cloud NEXT 컨퍼런스 |
4월 17일 수요일 | 18:00 | TIME100, 순다르 피차이 인터뷰 |
4월 18일 목요일 | 18:00 | 구글 CEO, 미중 AI 경쟁에 대해 언급 |
4월 19일 금요일 | 18:00 | 알파고 다큐멘터리 |
4월 20일 토요일 | 18:00 | 구글 창업자의 이야기 |
4월 21일 일요일 | 18:00 | BBC 다큐멘터리: 구글 없는 세상 |
슈퍼 뉴로 TV는 24시간, 주 7일 생중계로 방송됩니다. AI 분야에서 "전자 피클"을 얻으려면 클릭하세요:
http://live.bilibili.com/26483094
위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!
다음주에 뵙겠습니다!
HyperAI 소개
HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.
* 1200개 이상의 공개 데이터 세트에 대한 국내 가속 다운로드 노드 제공
* 300개 이상의 고전적이고 인기 있는 온라인 튜토리얼이 포함되어 있습니다.
* 100개 이상의 AI4Science 논문 사례 해석
* 500개 이상의 관련 용어 검색 지원
* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅
학습 여정을 시작하려면 공식 웹사이트를 방문하세요.