HyperAI초신경

주간 편집자 추천 | MathPile 수학적 추론 코퍼스 오픈 소스, Union Eye Hospital은 13가지 안저 질환 탐지를 돕기 위해 AI를 활용하고 있습니다.

特色图像

최근 상하이 교통대학교 생성 인공지능 연구실(GAIR)수학 분야에 맞춰 제작된 고품질의 다양한 사전 학습된 데이터 세트인 MathPile과 상용 버전인 MathPile-Commercial은 오픈 소스입니다.이제 hyper.ai 공식 웹사이트에서 다운로드할 수 있습니다! 다음과 같은 것이 더 있습니다 매스비스타 , Math23K 및 기타 인기 있는 수학 데이터 세트가 여러분의 사용을 기다리고 있습니다~

2월 19일부터 2월 23일까지 hyper.ai 공식 웹사이트가 업데이트되었습니다.

* 고품질 공개 데이터 세트: 10

* AI4S 종이 케이스 : 4개

* 인기 백과사전 항목: 10개

공식 웹사이트를 방문하세요:하이퍼.AI

선택된 공개 데이터 세트

1MathPile 수학적 추론 사전 훈련된 코퍼스

상하이 교통대학교의 생성 인공지능 연구실에서 MathPile 데이터 세트를 출시했습니다. 이는 약 95억 개의 토큰을 포함하고 있으며, 대규모 모델의 수학적 추론 능력을 향상시키도록 설계된, 수학 분야를 위해 특별히 사전 훈련된 고품질의 다양한 코퍼스입니다.

직접 사용:

https://hyper.ai/datasets/29543

2. MathPile-상업용 수학적 추론 사전 훈련 코퍼스(상업용 버전)

MathPile-Commercial은 MathPile의 상용 버전으로, MathPile에서 상업적 사용을 금지하는 문서를 제거하여 얻었습니다(최신 버전, v0.2). 구체적으로 연구팀은 arXiv 소스의 메타데이터에 있는 라이선스 정보를 사용하고 다른 소스에 키워드 매칭을 적용하여 비상업적 사용을 위한 소스 데이터를 테스트했습니다.

직접 사용:

https://hyper.ai/datasets/29545

3. AI가 생성한 이미지 데이터 세트

이 데이터 세트에는 Copilot이 생성한 소년 이미지 19개가 포함되어 있습니다. Copilot은 상상력이 풍부하고 혁신적인 콘텐츠를 만드는 AI 동반자입니다. 이러한 이미지는 얼굴 표정, 포즈, 배경, 조명 및 폐색이 다양하기 때문에 얼굴 및 포즈 감지 작업에 적합합니다.

직접 사용:

https://hyper.ai/datasets/29527

4. 다양한 AI가 생성한 초상화 데이터 세트

이 데이터 세트에는 고급 AI 알고리즘이 신중하게 제작한 고품질 이미지 140개가 포함되어 있으며, 여기에는 여성 초상화 70장과 남성 초상화 70장이 포함됩니다. 이 데이터 세트의 각 이미지는 AI가 인간 외모의 복잡성을 모방하는 놀라운 능력을 보여줍니다.

직접 사용:

https://hyper.ai/datasets/29529

5THUC뉴스  중국어 텍스트 분류 데이터 세트

THUCNews는 2005년부터 2011년까지의 Sina News RSS 구독 채널의 과거 데이터를 필터링하여 생성되었으며, 740,000개의 뉴스 문서(2.19GB)를 담고 있으며, 모두 UTF-8 일반 텍스트 형식입니다. 연구팀은 원래의 Sina News 분류 시스템을 기반으로 이를 재정, 복권, 부동산, 주식, 주택, 교육, 기술, 사회, 패션, 시사, 스포츠, 운세, 게임, 엔터테인먼트 등 14개 후보 카테고리로 재구성하여 나누었습니다.

직접 사용:

https://hyper.ai/datasets/29521

6. ShareGPT 90k 중국어 및 영어 이중 언어 인간-기계 질의응답 데이터 세트

ShareGPT-Chinese-English-90k는 중국어와 영어로 된 고품질의 이중 언어 인간-기계 질의 응답 데이터 세트로, 실제적이고 복잡한 시나리오에서의 사용자 질문 데이터를 다룹니다. 이 데이터 세트는 고품질 대화 모델을 학습하는 데 사용할 수 있습니다.

직접 사용:

https://hyper.ai/datasets/29523

7. SMP-2017 중국어 대화 의도 인식 데이터 세트

이 데이터 세트는 SMP2017 중국 인간-컴퓨터 대화 기술 평가(ECDT) 과제 1 데이터 세트입니다. 이 평가의 목적은 중국의 인간-컴퓨터 대화 시스템과 관련된 연구 개발을 촉진하는 것입니다.

직접 사용:

https://hyper.ai/datasets/29515

8. Toutiao 텍스트 분류 데이터 세트

이 데이터 세트는 투티아오 중국어 뉴스(단문)의 분류 데이터 세트입니다. 데이터 소스는 Toutiao 클라이언트입니다. 15개 카테고리와 382,688개의 텍스트를 포함하고 있으며, 수집 시기는 2018년 5월입니다.

직접 사용:

https://hyper.ai/datasets/29517

이번 주에 더 업데이트된 데이터세트를 보려면 방문하세요.:

https://hyper.ai/datasets

ScienceAI 논문 사례 연구

1. 베이징 의과대학 안과병원을 필두로 5개 안과 센터가 AI를 활용해 13개 안저질환 진단 지원에 협력

안과 질환의 진단은 영상 인식에 크게 의존하며, 안과학은 딥러닝과 같은 기술을 적용하기에 매우 적합합니다. 안저 질환 진단에 있어 딥 러닝의 잠재적 가치를 더욱 탐구하기 위해, 베이징 협화의과대학 병원 안과 부장인 천유신은 전국 5개 안과 센터, 베이징 지원 후이투 테크놀로지 주식회사, 중국 인민대학 정보학원의 리시롱 교수와 협력하여 딥 러닝 시스템을 공동으로 개발했습니다. 이 시스템은 초보 안과 의사들이 진단 일관성을 약 12%만큼 개선하는 데 도움이 되며 13가지 주요 안저 질환을 자동으로 감지하는 새로운 방법을 제공합니다. 해당 논문은 저널 "네이처"에 게재되었습니다.

전체 보고서 보기:

https://hyper.ai/news/29549

2. 50,000명 이상이 연구에 참여했으며, 저장대학교 Wu Xifeng 교수 팀은 새로운 연구 결과를 발표했습니다. 건강은 사무실 공간의 녹화 수준과 관련이 있습니다.

생태계 환경이 인간 건강에 미치는 영향은 미묘합니다. 저장대학교 보건대학원의 우시펑 교수 연구팀은 합성 신경망 모델을 사용하여 거리 풍경 이미지의 녹색 뷰 지수를 기반으로 눈에 보이는 녹색 노출을 평가한 다음, 직장에서 눈에 보이는 녹색의 수준과 성인의 대사 증후군 사이에 유익한 연관성이 있는지 알아보았습니다. 연구팀은 로지스틱 회귀 모델을 사용하여 항저우 성인 5만 명을 대상으로 업무 환경에서 눈에 띄는 야외 녹지 수준을 평가하고, 두 가지 사이의 유익한 연관성을 확인했습니다. 관련 결과는 "Environment International" 저널에 게재되었습니다.

전체 보고서 보기:

https://hyper.ai/news/29559

3. 상하이 교통대학교 AI4S팀은 학제간 AI 연구 지원팀을 구축하기 위해 '지능형 과학 시설' 개념을 제안했다.

상하이 교통대학교 인공지능 연구소 과학을 위한 AI  양샤오캉 교수와 팀의 다른 연구원들은 지능형 과학 시설을 구축하기 위한 개념을 제안했는데, 이는 과학 분야의 대형 모델, 생성적 시뮬레이션 및 역산, 자율적 지능형 무인 실험, 대규모 신뢰 과학 연구 협업 등의 혁신적 기능을 형성합니다. 관련 연구 결과는 "중국과학원 학술지"에 게재되었습니다.

전체 보고서 보기:

https://hyper.ai/news/29559

4. Amazon 엔지니어가 선정한 40여편의 LLM 논문 모음

점점 더 많은 회사와 전통 산업이 대규모 언어 모델을 자사 사업에 적용하는 방법을 모색하기 시작했습니다. 급속히 확대되는 시장 수요로 인해 관련 분야의 연구가 더욱 심화되고 혁신이 촉진되었으며, arXiv와 같은 플랫폼에서 논문 업데이트가 더욱 빈번해졌습니다. 모든 사람이 가치 있는 논문을 더 빨리 검색할 수 있도록 돕기 위해 Amazon 엔지니어인 유진 얀과 다른 사람들은 최첨단 논문을 지속적으로 공유하기 위해 언어 모델 논문 읽기 목록을 구축했습니다. 현재 40편 이상의 고품질 논문이 편찬되었습니다.

전체 논문 요약을 보려면 여기를 클릭하세요.

https://hyper.ai/news/29582

인기 백과사전 기사

1. 회상 회수율

2. 인간 피드백 강화 학습 RLHF

3. 일반 인공지능(AGI)

4. 검색 향상으로 RAG 생성

5. 신경 복사장(NeRF)

다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

https://hyper.ai/wiki

위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!

다음주에 뵙겠습니다!

HyperAI 소개

HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.

* 1200개 이상의 공개 데이터 세트에 대한 국내 가속 다운로드 노드 제공

* 300개 이상의 고전적이고 인기 있는 온라인 튜토리얼이 포함되어 있습니다.

* 100개 이상의 AI4Science 논문 사례 해석

* 500개 이상의 관련 용어 검색 지원

* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅

학습 여정을 시작하려면 공식 웹사이트를 방문하세요.

https://hyper.ai/