HyperAI초신경

주간 편집자 추천 | 힐셸 음성 데이터세트 시리즈 출시, 중국 학자들이 유방암 예후 평가 시스템 MIRS 개발

特色图像

🏮춘절 기간 동안 우리는 수천 마일을 여행하여 가족들을 만납니다.

🏮지상에서 펼쳐지는 불꽃놀이, 강렬한 새해 분위기, 가족과 함께하는 즐거움

옥토끼에게 작별 인사를 하고 황금용과 함께 봄을 맞이하세요. 내일 밤은 새해 전날이에요!HyperAI에서 여러분께 미리 행복한 중국 설날을 기원합니다. ~ 여러분 모두가 행복한 중국 설날을 보내시길 바랍니다!이번 주, hyper.ai 공식 웹사이트에서는 힐 베이크가 수천 시간을 들여 만든 오픈소스 중국어 음성 데이터베이스를 출시하여 여러분의 목소리로 향하는 문을 열었습니다.

2월 5일부터 2월 8일까지 hyper.ai 공식 웹사이트가 업데이트됩니다.

* 고품질 공개 데이터 세트: 8

* AI4S 종이 케이스 : 2개

* 인기 백과사전 항목: 8개

공식 웹사이트를 방문하세요:하이퍼.AI

선택된 공개 데이터 세트

1. AISHELL-1 오픈소스 중국어 음성 데이터베이스

이 데이터 세트는 중국 여러 지역의 다양한 악센트를 가진 400명의 사람들에 의해 기록되었습니다. 전문 음성 교정자가 필사하고 주석을 달고 엄격한 품질 검사를 통과한 이 데이터베이스의 텍스트 정확도는 95% 이상입니다. 훈련 세트, 개발 세트, 테스트 세트로 나뉩니다.

직접 사용:

https://hyper.ai/datasets/29344

2. AISHELL-2 중국어 음성 데이터베이스

AISHELL-2 중국어 중국어 음성 데이터베이스에는 1,000시간 분량의 음성이 포함되어 있습니다. 녹음된 텍스트에는 웨이크업 단어, 음성 제어 단어, 스마트 홈, 무인 운전, 산업 생산을 포함한 12개 분야가 포함됩니다.

직접 사용:

https://hyper.ai/datasets/29347

3. AISHELL-3 고충실도 중국어 음성 데이터베이스

이 데이터 세트는 중국의 다양한 악센트 지역에 거주하는 218명을 대상으로 기록되었습니다. 전문적인 음성 교정자들이 병음과 리듬을 표시하고, 엄격한 품질 검사를 통과했습니다. 이 데이터베이스의 음성 정확도는 98% 이상입니다.

직접 사용:

https://hyper.ai/datasets/29352

4. AISHELL-4 다채널 중국어 회의 연설 데이터베이스

AISHELL-4는 각각 4~8명의 발표자가 참여한 211개의 녹음된 컨퍼런스 세션으로 구성되어 있으며, 총 길이는 120시간입니다. 이는 음성 프런트엔드 처리 및 음성 인식과 같은 개별 작업에 사용할 수 있습니다.

직접 사용:

https://hyper.ai/datasets/29375

5. AISHELL-WakeUp-1 중국어 및 영어 웨이크업 단어 음성 데이터베이스

이 데이터 세트에는 254명의 화자가 녹음에 참여했으며, 총 약 400만 개의 깨어나는 단어 음성과 1,561.12시간이 담겨 있습니다. 녹음된 텍스트는 "안녕, 미아", "하이, 미아"라는 깨우는 단어입니다. 이 데이터베이스는 전문 음성 교정자에 의해 필사 및 주석이 작성되었으며 엄격한 품질 검사를 통과했습니다. 음성인식, 음성인식 등의 연구에 활용될 수 있습니다.

직접 사용:

https://hyper.ai/datasets/29186

6. AISHELL-DMASH 중국어 만다린 마이크 어레이 홈 장면 음성 데이터베이스

AISHELL-DMASH 데이터 세트는 두 개의 서로 다른 방에서 실제 스마트 홈 시나리오를 통해 기록되었으며 30,000시간 분량의 음성 데이터를 포함하고 있습니다. 이 데이터 세트는 단어 정확도 98%의 전문 음성 주석자에 의해 필사되었습니다. 음성인식, 음성인식, 웨이크업 단어 인식 등의 연구에 활용될 수 있습니다.

직접 사용:

https://hyper.ai/datasets/29380

7.DeepSymNet 딥 심볼 네트워크 데이터 세트

이는 중국과학원 반도체 연구소의 연구자들이 제안한 DeepSymNet이라는 새로운 상징적 네트워크로, 상징적 표현을 표현하고 상징적 회귀에 사용됩니다.

직접 사용:

https://hyper.ai/datasets/29321

8. Evol Instruct 중국어 GPT4 텍스트 데이터 세트

이 데이터 세트는 다음과 같은 방식으로 생성되었습니다.

(1) Evol-instruct-70k의 영어 질문을 중국어로 번역합니다.

(2) GPT4에 중국어 답변을 생성하도록 요청합니다.

직접 사용:

https://hyper.ai/datasets/29318

사이언스AI  선택된 사례 연구

1.  세계에서 가장 흔한 암을 목표로 중국 학자들은 유방암 예후 평가 시스템인 MIRS를 구축했습니다.

최근 중국 학자들은 신경망 모델을 사용하여 유방암의 예후와 치료를 예측하는 MIRS 점수 시스템을 구축했습니다. 이는 유방암 환자의 치료 전략을 수립하는 데 도움이 될 수 있습니다. 관련 논문이 게재되었습니다.아이사이언스"신문.

전체 보고서 보기:

https://hyper.ai/news/29304

2. 중국과학원 선전선진기술원에서는 Few-Shot Learning 프레임워크를 기반으로 동물의 사회적 행동을 분석하는 SBeA를 제안했습니다.

동물 행동 연구에서는 기술 혁신을 통해 연구 효율성과 정확성을 시급히 개선해야 합니다. 이를 바탕으로 SBeA(Social Behavior Atlas)가 탄생했습니다. 중국과학원 산하 선전선진기술원에서 개발한 이 기술은 자유롭게 생활하는 동물의 행동을 종합적으로 정량화하고, 소수의 라벨이 부착된 프레임(약 400개 프레임)을 사용하여 다중 동물 3D 매핑을 수행할 수 있습니다.포즈 추정양방향 전이 학습 전략을 통해 다중 동물 식별 인식의 정확도가 90%를 초과합니다. 관련 결과는 저널 "네이처"에 게재되었습니다.

전체 보고서 보기:

https://hyper.ai/news/29353

인기 백과사전 기사

1. 초당 부동 소수점 연산 실패작

2. 랜덤 워크

3. 가상 스크리닝

4. 음악 정보 검색(MIR)

5. 양자 신경망

다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

https://hyper.ai/wiki

위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!

중국 설날이 다가옴에 따라 HyperAI는 다시 한번 모든 분께 행운과 번영, 그리고 행복하고 만족스러운 삶을 기원합니다!새해에는 더욱 놀라운 일을 선사해 드리겠습니다!

용의 해에 만나요!

HyperAI 소개

HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.

* 1200개 이상의 공개 데이터 세트에 대한 국내 가속 다운로드 노드 제공

* 300개 이상의 고전적이고 인기 있는 온라인 튜토리얼이 포함되어 있습니다.

* 100개 이상의 AI4Science 논문 사례 해석

* 500개 이상의 관련 용어 검색 지원

* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅

학습 여정을 시작하려면 공식 웹사이트를 방문하세요.

https://hyper.ai/