HyperAI초신경

최근 뉴욕대학교 컴퓨터 과학 조교수이자 얀 르쿤의 학생인 알프레도 칸지아니가 봄 학기 "AI 강좌"를 공개했는데, 이 강좌에서는 이산 확률과 나이브 베이즈, 퍼셉트론과 로지스틱 회귀, 최적화, 통계와 신경망 자연어 처리, 신경망 분류, 순환 신경망과 합성곱 신경망 등의 주제를 다룹니다.
이번 주에 HyperAI는 B Station에서 24시간 내내 강의를 생중계할 예정입니다. 같이 배워요~

시청 링크:

http://live.bilibili.com/26483094

6월 24일부터 6월 28일까지 hyper.ai 공식 웹사이트가 업데이트됩니다.

고품질 공개 데이터 세트: 10
고품질 튜토리얼 선택: 3
커뮤니티 기사 선택: 4개 기사
인기 백과사전 항목: 5
7월에 마감일이 있는 주요 컨퍼런스: 4

공식 웹사이트를 방문하세요:하이퍼.AI

선택된 공개 데이터 세트

1. GeoChat 원격 감지 다중 모드 지침 추적 데이터 세트

이 데이터 세트에는 약 318,000개의 명령어가 포함되어 있으며, 다중 작업 대화 도우미를 훈련하기 위해 원격 감지 도메인에 다중 모드 명령어 적응을 확장하는 것을 목표로 합니다. 관련 논문 결과는 CVPR 2024에 수락되었습니다.

직접 사용:https://go.hyper.ai/CXu0K

2. RRSIS-D 대규모 원격탐사 이미지 분할 데이터 세트

이 데이터 세트에는 다양한 공간 해상도와 객체 방향을 포괄하는 17,402개의 이미지-설명-마스크 트리플릿이 포함되어 있습니다. 관련 논문 결과는 CVPR 2024에 수락되었습니다.

직접 사용:https://go.hyper.ai/1VRQG

3. Earth Parser 데이터 세트 원격 감지 매핑 데이터 세트

이 데이터 세트는 대규모의 큐레이션되지 않은 항공 LiDAR 스캔에 대한 분석 방법을 훈련하고 평가하는 데 사용됩니다. 이 데이터 세트에는 7.7제곱킬로미터가 넘는 면적을 포함하는 7개의 장면과 총 9,800만 개의 3D 포인트가 포함되어 있습니다. 관련 논문 결과는 CVPR 2024에 수락되었습니다.

직접 사용:https://go.hyper.ai/3pFjm

4. Harvard-GF3300 망막 신경 질환(녹내장) 데이터 세트

이 데이터 세트는 3,300명의 피험자를 포함하고 2D 및 3D 이미지 데이터를 포함하는 망막 신경 질환(녹내장) 데이터 세트입니다. 이 데이터 세트에는 백인, 흑인, 아시아인이라는 세 가지 주요 인종 그룹에서 동일한 수의 주제가 포함되어 있어 공정한 학습 문제를 야기할 수 있는 데이터 불균형 문제를 피할 수 있습니다.

직접 사용:https://go.hyper.ai/vIhu6

5. 분석을 위한 치과 X-선 이미지 치과 X-선 이미지 데이터 세트

이 데이터 세트에는 다양한 치과 교정 단층촬영(OPG) X선 이미지와 70개의 고품질 샘플이 포함되어 있습니다. 이 데이터 세트는 주석을 제공함으로써 치아 유형 분류, 이상 감지 등과 같은 치과 이미지 분석 작업을 위한 머신 러닝 모델을 훈련하고 테스트하는 데 사용될 수 있습니다.

직접 사용:https://go.hyper.ai/vK9zz

6. 다중 영역 골절 X선 데이터 세트

데이터 세트에는 하지, 상지, 요추, 엉덩이, 무릎 등 모든 해부학적 신체 부위를 포함하는 골절 및 비골절 X선 이미지가 포함되어 있습니다. 데이터 세트는 총 10,580개의 방사선 이미지(X선) 데이터를 포함하는 훈련, 테스트 및 검증 폴더로 나뉩니다.

직접 사용:https://go.hyper.ai/Yk1bA

7. 과일 및 채소 이미지 인식 데이터 세트

이 데이터 세트에는 10가지 종류의 과일과 26가지 종류의 채소 이미지가 포함되어 있으며, 각 카테고리는 훈련 세트, 테스트 세트, 검증 세트로 구분되어 이미지 인식 작업에 다양한 세트를 제공합니다.

직접 사용:https://go.hyper.ai/FdfRK

8. 캐릭터 코덱스

이 데이터 세트에는 다양한 미디어 유형과 장르의 인기 캐릭터 15,939명에 대한 정보가 포함되어 있습니다. 각 항목에는 캐릭터, 미디어 출처, 캐릭터와 관련된 독특한 장면에 대한 세부 정보가 포함되어 있습니다.

직접 사용:https://go.hyper.ai/wf1q1

9. RepLiQA는 벤치마킹을 위한 가능한 질문 답변 데이터 세트입니다.

RepLiQA는 17개 주제 또는 문서 범주를 포괄하는 "컨텍스트-질문-답변" 3중 구조로 구성된 평가 데이터 세트로, 대규모 언어 모델(LLM)이 제공된 문서에서 컨텍스트 정보를 찾아 사용하는 능력을 테스트하도록 설계되었습니다.

직접 사용:https://go.hyper.ai/ZkSYD

10. CS-Eval 대규모 모델 네트워크 보안 평가 데이터 세트

이 데이터 세트는 네트워크 보안의 11개 주요 영역, 42개 하위 영역, 4,369개의 객관식 문제, 참/거짓 문제, 지식 추출 문제를 다룹니다. 지식과 실무에 기반한 포괄적인 평가 과제를 제공하고, 사용자의 자체 평가를 지원하며, 네트워크 보안에서 대규모 모델을 구현하기 위한 참고 자료와 영감을 제공합니다.

직접 사용:https://go.hyper.ai/ziacf

더 많은 공개 데이터 세트를 보려면 다음을 방문하세요.

https://hyper.ai/datasets

선택된 공개 튜토리얼

1. Bioclip 생물학적 분류 계층적 예측 데모

이 튜토리얼 데모는 주어진 생물학적 이미지를 과, 속, 종 등으로 분류할 수 있습니다. 이는 CVPR2024의 최우수 학생 논문 "BioCLIP: 생명나무를 위한 비전 기반 모델"에 포함된 모델의 Gradio 버전입니다.

온라인으로 실행:https://go.hyper.ai/OEWk1
2. InstantStyle - 일관된 이미지 생성기

InstantStyle은 Xiaohongshu의 InstantX 팀이 개발한 텍스트-이미지 생성 프레임워크로, 콘텐츠의 텍스트 제어성을 유지하면서 스타일을 전송합니다. 이 튜토리얼은 여러분을 위해 관련 환경을 구축하였으며, 클릭 한 번으로 체험해 보실 수 있습니다!

온라인으로 실행:https://go.hyper.ai/E6GuW

3. 5초 안에 고품질 기사를 생성하세요. Llama 3-Chinese-Chat 데모는 한 번의 클릭으로 시작됩니다!

이 모델은 Meta-Llama-3-8b-Instruct 모델을 기반으로 중국어에 맞게 특별히 조정된 중국어 채팅 모델입니다. 원래의 Meta-Llama-3-8b-Instruct 모델과 비교했을 때, "영어 답변이 있는 중국어 질문"과 중국어와 영어가 혼합된 질문의 수가 크게 줄었습니다. 컨테이너를 복제하고 시작한 다음, 생성된 API 주소를 직접 복사하여 모델에서 추론을 경험해 보세요.

온라인으로 실행:https://go.hyper.ai/BLHcM

커뮤니티 기사

1. 세계 최강의 철기반 초전도 자석이 탄생했습니다! 과학자들은 기존 기록보다 2.7배 더 강한 자기장 강도를 가진 머신러닝 기반 새로운 연구 시스템을 설계했습니다.

영국과 일본의 과학자들은 머신 러닝 기술을 사용하여 연구자 중심 방법과 데이터 중심 방법을 결합한 연구 시스템을 설계하고, 세계에서 가장 강한 철 기반 초전도 자석을 성공적으로 생산했습니다. 이 글은 연구에 대한 자세한 해석과 공유입니다.

이벤트 세부 정보 보기:https://go.hyper.ai/RxV9x

2. 베이징대학병원 부원장 리젠핑: AI를 활용해 임상 심근 허혈 예측의 어려움, 병목 현상, 고통스러운 점 해결

베이징 지위안 학술대회에서 베이징대학 제1병원 부원장이자 심혈관의학연구소 소장인 리젠핑 교수는 "임상적 심근 허혈 예측의 방법과 어려움"이라는 주제로 관상동맥 심장질환 진단 및 임상적 심근 허혈 예측 분야에서 AI의 새로운 탐구와 실무에 대해 공유했습니다. 이를 통해 관상동맥 심장병 환자의 진단 및 치료에 새로운 접근 방식이 제공되고, 초점이 심장에서 신장으로 확장되어 AI가 임상 의학에서 더 큰 역할을 할 수 있을 것으로 기대됩니다. 이 기사는 연설의 자세한 요약입니다.

전체 인터뷰를 읽어보세요:https://go.hyper.ai/5X9jM

3억 1천만 개의 매개변수를 가진 셀 모델이 출시되었습니다! 청화대 연구팀, 네이처 저널에 scFoundation 게재: 2만개 유전자 동시 모델링

청화대학교 연구팀은 5,000만 개의 세포에서 얻은 유전자 발현 데이터를 기반으로 훈련된 sc-Foundation이라는 대규모 세포 모델을 제안했습니다. 1억 개의 매개변수를 가지고 있으며, 약 2만 개의 유전자를 동시에 처리할 수 있습니다. 기본 모델로서, 세포 시퀀싱 심도 강화, 세포 약물 반응 예측, 세포 교란 예측 등 다양한 생물의학 하위 작업에서 탁월한 성능 향상을 보여줍니다. 이 글은 연구에 대한 자세한 해석과 공유입니다.

전체 보고서 보기:https://go.hyper.ai/v5i5K

4. AI 실무자들은 어떻게 과학을 수행하나요? 청화대학교 AIR 주하오: 텍스트 생성부터 단백질 설계까지 국경 간 탐구

최근, 청화대학교 지능산업연구소의 저우하오 교수는 컴퓨터 실무자로서 단백질 설계에 있어 AI가 직면한 여러 과제를 모든 사람과 공유하고, 단백질 분야의 최신 첨단 연구를 데이터 구조, 생성 알고리즘, 단백질 사전 학습의 세 가지 측면에서 설명했습니다. 본 기사는 주하오 교수의 심도 있는 공유 내용을 보도합니다.

전체 보고서 보기:https://go.hyper.ai/PTyAp

인기 백과사전 기사

1. 스케일링 정리 스케일링 법칙

2. 상호 순위 퓨전 RRF

3. 신경 복사장(NeRF)

4. 대규모 멀티태스크 언어 이해(MMLU)

5. 콜모고로프-아놀드 표현 정리

다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

https://hyper.ai/wiki

B 스테이션 생방송 미리보기

AI프레도 칸지아니는 뉴욕대학교의 컴퓨터 과학 조교수이자 얀 르쿤의 학생입니다. 그는 최근 봄학기 "AI 강좌" 영상을 공개했습니다. 각 장에서 가르치는 지식에는 이산 확률과 나이브 베이즈가 포함됩니다. 퍼셉트론과 로지스틱 회귀; 최적화, 통계 및 신경 자연어 처리 신경망 분류 등 이번 주 슈퍼 뉴로 TV는 24시간 내내 생중계로 강의를 방송합니다.

다음 표는 편집자가 선택한 콘텐츠의 미리보기입니다↓↓↓

날짜	시간	콘텐츠
7월 1일 월요일	18:00	1부: 나이브 베이즈 소개
7월 2일 화요일	18:00	2부 나이브 베이즈 분류
7월 3일 수요일	18:00	3부 나이브 베이즈 매개변수 추정 및 라플라스 평활화
7월 4일 목요일	18:00	4부. 이진 분류기 평가
7월 5일 금요일	18:00	5부 다중 클래스 퍼셉트론 이진 및 다중 클래스 로지스틱 회귀
7월 6일 토요일	18:00	6부 최적화 및 경사 상승
7월 7일 일요일	18:00	Alfredo Canziani의 에너지 기반 자기 감독 학습에 대한 강연

슈퍼 뉴로 TV는 24시간, 주 7일 생중계로 방송됩니다. AI 분야에서 "전자 피클"을 얻으려면 클릭하세요:

http://live.bilibili.com/26483094

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://hyper.ai/events

위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!

다음주에 뵙겠습니다!

HyperAI 소개

HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다. 우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.

1300개 이상의 공개 데이터 세트에 대한 국내 가속 다운로드 노드 제공
400개 이상의 고전적이고 인기 있는 온라인 튜토리얼이 포함되어 있습니다.
100개 이상의 AI4Science 논문 사례 해석
500개 이상의 관련 용어 검색 지원
중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅

학습 여정을 시작하려면 공식 웹사이트를 방문하세요.

https://hyper.ai

Command Palette

중국어 자막만 제공됩니다! LeCun 학생 Alfredo의 봄 AI 수업이 시작됩니다. CVPR'24 원격 감지 데이터 세트 다운로드