HyperAI초신경

주간 편집자 추천 | RJUA-QA 의료 데이터 세트 출시, 3D 분자 생성 모델 ResGen 논문 분석

일 년 전
정보
zhaorui
特色图像

HyperAI의 새로운 칼럼이 나왔습니다~HyperNeural 편집부는 매주 월요일, 지난주에 hyper.ai 공식 웹사이트에 업데이트된 콘텐츠(데이터 세트, AI4S 논문 사례, 백과사전 항목)를 선정하여 여기에 게시합니다. hyper.ai를 직접 방문하여 모든 콘텐츠를 확인해 보세요!

1월 15일부터 1월 21일까지 hyper.ai 공식 웹사이트가 빠르게 업데이트되었습니다.

* 고품질 공개 데이터 세트: 10

* AI4S 종이 케이스 : 2개

* 인기 백과사전 항목: 10개

공식 웹사이트를 방문하세요:https://hyper.ai/

선택된 공개 데이터 세트

1크로스독2020:레스젠  연구를 위해 처리된 데이터 세트

초기 데이터 세트에는 2,200만 개 이상의 단백질-리간드 쌍이 포함되어 있습니다. 이 데이터 세트는 단백질-소분자 상호작용 연구, 특히 단백질 포켓에 대한 분자의 결합 능력을 평가하는 데 사용할 수 있습니다.

직접 사용:

https://hyper.ai/datasets/29021

2. RJUA-QA: 최초의 중국 의학 전문 분야 질의응답 추론 데이터 세트

RJUA-QA는 의과 비뇨의학 전문 분야를 위한 혁신적인 질의응답 추론 데이터 세트입니다. 이 데이터 세트는 Ant Group Medical LLM 팀과 상하이 교통대학교 의과대학 산하 런지 병원의 비뇨기과 전문가 팀 간의 협력으로 만들어졌습니다. 이 데이터 세트는 실제 임상 환자 데이터를 Q-context-A(질문-맥락-답변) 형식으로 표현된 가상 환자 임상 대화로 변환하기 위해 개발되었습니다.

직접 사용:

https://hyper.ai/datasets/28970

3. MetaMathQA 수학적 추론 데이터 세트

모델의 순방향 및 역방향 추론 기능을 개선하기 위해 케임브리지 대학교, 홍콩과학기술대학교, 화웨이의 연구진은 일반적으로 사용되는 두 가지 수학 데이터 세트(GSM8K 및 MATH)를 기반으로 하는 MetaMathQA 데이터 세트를 제안했습니다. 이 데이터 세트는 적용 범위가 넓고 품질이 높은 수학적 추론 데이터 세트입니다. MetaMathQA는 대규모 언어 모델에 의해 생성된 395,000개의 순방향-역방향 수학 질문-답변 쌍으로 구성되어 있습니다.

직접 사용:

https://hyper.ai/datasets/28954

4. M³IT 다중 모드 다국어 교육 튜닝 데이터 세트

이 데이터 세트는 240만 개의 인스턴스를 포함하는 40개의 데이터 세트와 400개의 수동으로 작성된 작업 지침으로 구성되며, 비전-텍스트 구조로 재포맷되었습니다. 이 데이터 세트는 캡션, 시각적 질의응답(VQA), 시각적 조건 생성, 추론, 분류를 포함한 고전적인 시각 언어 작업의 다양한 작업을 수집한 것입니다.

직접 사용:

https://hyper.ai/datasets/29048

5. ChatHaruhi-RolePlaying 롤플레잉 대화 데이터 세트

ChatHaruhi는 32개의 중국어/영어 TV/애니메이션 캐릭터와 54,000개 이상의 시뮬레이션 대화를 포함하는 데이터 세트입니다. 대규모 언어 모델로 구축된 롤플레잉 챗봇이 폭넓은 관심을 끌었습니다. 연구팀은 특정한 가상 인물을 모방하기 위해 대본에서 추출한 문자의 프롬프트와 메모리를 개선하여 언어 모델을 제어하는 알고리즘을 제안했습니다. 연구팀은 영화, 소설, 대본에서 코퍼스를 수집하고 구조화된 추출을 수행하여 23,000개 이상의 대화 메시지를 수집했습니다.

직접 사용:

https://hyper.ai/datasets/28926

이번 주에 더 업데이트된 데이터세트를 보려면 다음을 방문하세요.

https://hyper.ai/datasets

사이언스AI  논쟁선택된 사례 연구

1. 최고의 기술보다 8배 더 빠름: 후팅쥔 외 저장대학교의 연구진은 단백질 포켓을 기반으로 한 3D 분자 생성 모델인 ResGen을 제안했습니다.

저장대학교와지장 연구실연구팀은 단백질 포켓을 기반으로 한 3D 분자 생성 모델인 ResGen을 제안했는데, 이는 기존의 최고 기술보다 8배 빠르며, 결합 에너지가 낮고 다양성이 높은 약물 유사 분자를 생성하는 데 성공했습니다. 해당 논문은 네이처 저널에 게재되었습니다.

전체 보고서 보기:

https://hyper.ai/news/29026

2. 중국과학원 Luo Xiaozhou 연구팀은 효소 반응 속도론 매개변수를 고정밀도로 예측하기 위한 대규모 모델 + 머신러닝인 UniKP 프레임워크를 제안했습니다.

중국과학원 선전선진기술연구소의 뤄샤오저우 연구팀은 다양한 효소 반응 속도론적 매개변수를 예측하기 위해 효소 반응 속도론적 매개변수 예측 프레임워크(UniKP)를 제안했습니다. 해당 논문은 네이처 저널에 게재되었습니다.

전체 보고서 보기:

https://hyper.ai/news/29000

인기 백과사전 기사

1. 시그모이드 함수

2. 마르코프 체인(마르코프 체인)

3. 큐워드 공격 (신속한 주입)

4. 보상 모델

5. 신속한 엔지니어링

다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

https://hyper.ai/wiki

위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!

다음주에 뵙겠습니다!

HyperAI 소개

HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.

* 1200개 이상의 공개 데이터 세트에 대한 국내 가속 다운로드 노드 제공

* 300개 이상의 고전적이고 인기 있는 온라인 튜토리얼이 포함되어 있습니다.

* 100개 이상의 AI4Science 논문 사례 해석

* 500개 이상의 관련 용어 검색 지원

* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅

학습 여정을 시작하려면 공식 웹사이트를 방문하세요.

https://hyper.ai/