HyperAI초신경

주간 편집자 추천 | Deepmoney 재무 모델 온라인 실행, AI 선호도 및 기타 고품질 데이터 세트 온라인

特色图像

현재 AI 분야의 금융 모델에 대한 연구 결과 대부분은 공개된 지식을 기반으로 학습되었습니다. 그러나 실제 금융 실무에서는 이러한 공공 지식을 현재 시장에 적용하는 것이 종종 심각하게 부족합니다. 이상적인 금융 빅 모델은 뉴스나 데이터 이벤트를 이해하고 주관적, 정량적 관점에서 즉시 평가할 수 있어야 합니다.
Deepmoney는 이러한 목적을 위해 만들어졌습니다. 금융 분야의 투자에 초점을 맞춘 대규모 언어 모델 프로젝트입니다. hyper.ai 공식 웹사이트에서 이제 온라인 운영 튜토리얼을 제공하니, 와서 직접 체험해 보세요!

3월 18일부터 3월 22일까지 hyper.ai 공식 웹사이트가 업데이트되었습니다.

* 고품질 공개 데이터 세트: 10

* 고품질 튜토리얼 선택: 3개

* 커뮤니티 게시물 선정 : 3개 게시물

* 인기 백과사전 항목: 10개

공식 웹사이트를 방문하세요:하이퍼.AI

선택된 공개 데이터 세트

1. OpenHermesPreferences: AI 선호도 데이터 세트 OpenHermesPreferences 데이터 세트는 Argilla가 Hugging Face H4 팀과 협력하여 만든 것으로 약 100만 개의 AI 선호도 데이터를 담고 있습니다. 이 데이터 세트는 선호도 모델을 훈련하거나 직접적인 선호도 최적화와 같은 기술을 통해 언어 모델을 정렬하는 데 사용할 수 있습니다.

직접 사용:

https://my5353.com/30168

2. LongAlign 10K 대형 모델 긴 컨텍스트 정렬 데이터 세트

LongAlign-10k는 청화대학교에서 장기 컨텍스트 정렬 작업에서 대규모 모델이 겪는 과제를 해결하기 위해 제안한 데이터 세트입니다. 여기에는 길이가 8k에서 64k 사이인 10,000개의 긴 명령어 데이터가 포함되어 있습니다. 이 데이터 세트는 긴 맥락에서 대형 모델의 성능과 10k~100k 길이의 작업 지침을 따르는 능력을 평가하도록 설계되었습니다.

직접 사용:

https://my5353.com/30247

3. CyberMetric 대규모 모델 사이버 보안 평가 데이터 세트

CyberMetric 데이터 세트에는 대규모 모델의 사이버 보안 지식을 종합적으로 평가하도록 설계된 10,000개의 질문이 포함되어 있습니다. 이 데이터 세트는 다양한 대규모 모델을 사용하여 만들어졌으며, 사이버 보안 분야 전문가가 검증하여 관련성과 정확성을 보장했습니다.

직접 사용:

https://my5353.com/30251

4. 2020 중국 지상 태양광 발전소 10m 국가 축척 지도 데이터 세트

중국농업대학은 중국과학원 지리과학원 및 자연자원연구소와 협력하여 중국 내 국가 지상 태양광 발전소 분포에 대한 고해상도 오픈소스 데이터가 부족한 문제를 해결하기 위해 국가적 매핑 방법을 개발했습니다. 그들은 2020년 국가 10m 해상도 지상 태양광 발전소 분류 데이터 세트를 성공적으로 공개했습니다. 이번 성과는 우리나라 태양광 발전소의 공간적 분포 특성을 정확하게 보여줄 뿐만 아니라, 분류 정확도 89%로 에너지 계획, 토지 이용, 원격 감지 모니터링, 환경 연구를 위한 귀중한 데이터 자원을 제공합니다. 이러한 움직임은 중국 내 이 분야의 데이터 격차를 메우고 관련 연구에 큰 의미를 갖습니다.

직접 사용:

https://my5353.com/30283

5. 작물 질병 분류 작물 질병 분류 이미지 데이터 세트

이 데이터 세트에는 카사바 세균성 시들음병(CBB), 카사바 갈색 줄무늬병(CBSD), 카사바 녹색 반점병(CGM), 카사바 모자이크병(CMD), 건강함으로 분류된 5가지 작물 질병에 대한 분류된 이미지가 포함되어 있습니다. 식물 질병을 탐지하는 기계 학습 모델을 훈련하거나, 식물을 자동으로 진단하는 알고리즘을 개발하는 데 사용할 수 있습니다.

직접 사용:

https://my5353.com/30293

6. 토마토 잎 질병 감지 토마토 잎 질병 이미지 감지 데이터 세트

이 데이터 세트는 토마토 잎 질병 이미지 감지 데이터 세트입니다. 이미지는 다음과 같은 카테고리로 구분됩니다: 건강, 세균성 반점, 초기 역병, 건강, 후기 역병, 잎곰팡이병, 표적 지점 및 검은 반점. 이미지는 YOLO v5 PyTorch 형식으로 주석이 달려 있습니다.

직접 사용:

https://my5353.com/30306

7. AMAZON REVIEWS 2023 대규모 Amazon 리뷰 데이터 세트

AMAZON REVIEWS 2023은 McAuley Lab에서 2023년에 수집한 대규모 Amazon 리뷰 데이터 세트로, 33개의 다양한 카테고리를 포괄하는 5억 7천만 개 이상의 리뷰와 4,800만 개의 제품을 포함하고 있습니다.

직접 사용:

https://my5353.com/30267

8. DiFF 확산 모델 생성 얼굴 위조 데이터 세트

DiFF는 산둥대학교, 싱가포르 국립대학교 및 기타 기관이 공동으로 개발한 고품질의 대규모 얼굴 위조 이미지 데이터 세트입니다. 이는 확산 모델을 기반으로 생성되었으며 50만 개 이상의 이미지를 포함하고 있습니다. 이 데이터 세트는 얼굴 위조 감지, 적대적 공격 및 딥페이크 방어, 기타 관련 컴퓨터 비전 작업 훈련에 적합합니다.

직접 사용:

https://my5353.com/30260

9. MIntRec2.0 다중 모드 의도 인식 대화 데이터 세트

MIntRec2.0은 청화대학교 등이 제안한 대규모 다중 모드 다자간 벤치마크 데이터 세트로, 특히 대화에서 의도를 파악하고 의도하지 않은 콘텐츠를 감지하는 데 사용됩니다. 이전 MIntRec과 비교했을 때 MIntRec2.0의 데이터 볼륨은 15,000으로 늘어났으며, 30개의 의도 범주를 포괄하고 있으며, 텍스트, 비디오, 오디오와 같은 여러 모달리티를 포함하는 약 9.3K개의 의도 내 주석 문장과 5.7K개의 의도 외 주석 문장을 포함합니다.

직접 사용:

https://my5353.com/30166

10. ApolloCorpora 다국어 의료 데이터 세트

ApolloCorpora는 선전 빅데이터 연구소와 홍콩 중국 대학 연구팀이 공동으로 구축한 다국어 의료 데이터 세트입니다. 이 데이터 세트는 영어, 중국어, 힌디어, 스페인어, 프랑스어, 아랍어를 포함하여 전 세계 61억 명이 사용하는 6개 주요 언어를 다룹니다.

직접 사용:

https://my5353.com/30285

더 많은 공개 데이터 세트를 보려면 방문하세요.:

https://hyper.ai/datasets

선택된 공개 튜토리얼

1. Deepmoney-34b-full을 온라인으로 실행하세요

Deepmoney는 금융 분야의 투자에 초점을 맞춘 대규모 언어 모델 프로젝트입니다. Deepmoney-34b-full은 01-ai 오픈 소스 Yi-34B-200K 모델을 기반으로 훈련되었으며, 이 모델은 pt(전체 매개변수 훈련)와 sft(lora 미세 조정)의 두 단계로 나뉩니다. 이제 Super Neuro 공식 웹사이트에서 클릭 한 번으로 복제하여 사용할 수 있습니다.

온라인으로 실행:

https://my5353.com/t30314

2. Deepmoney-miqu-70b를 온라인으로 실행하세요

이 모델은 huggingface.co의 miqu-1-70b-sf를 기반으로 훈련되었으며, SFT(Lora fine-tuning)만 수행되었습니다. 이제 SuperNeural 공식 웹사이트에서 클릭 한 번으로 복제하여 사용할 수 있습니다.

온라인으로 실행:

https://my5353.com/t30314

3. Deepmoney-67b-full을 온라인으로 실행하세요

이 모델은 deepseek-ai가 오픈 소스로 공개한 deepseek-llm-67b-base를 기반으로 훈련되었습니다. 이는 pt(로라 훈련)와 sft(로라 훈련)의 두 단계로 나뉩니다. 이제 SuperNeural 공식 웹사이트에서 클릭 한 번으로 복제하여 사용할 수 있습니다.

온라인으로 실행:

https://my5353.com/t30310

커뮤니티 기사

1. NVIDIA Huang Renxun은 H100보다 추론 능력이 30배 높고 에너지 소모가 25배 낮은 GB200을 출시하여 AI4S 기능을 마이크로서비스로 전환

올해의 2024 GTC AI 컨퍼런스가 예정대로 개최되었습니다. 3월 18일부터 3월 21일까지 900회 이상의 회의와 20회 이상의 기술 강의가 진행되었습니다. 이 기사는 젠슨 황의 GTC 기조연설을 요약한 것입니다.

전체 보고서 보기:

https://my5353.com/p30224

2. Argonne National Laboratory는 33분 만에 120,000개의 탄소 포집 후보 물질을 생성하는 MOF 혁신을 가속화하는 생성적 AI 프레임워크를 출시했습니다.

미국 Argonne National Laboratory의 연구팀은 생성적 AI 프레임워크인 GHP-MOFsassemble을 제안했습니다. 이 프레임워크는 새로운 MOF 구조를 무작위로 생성하고 조립하고, 분자 동역학 시뮬레이션을 통해 매우 안정적인 MOF 구조를 선별하고, 결정 그래프 신경망(CGCNN)과 그랜드 캐노니컬 몬테카를로 시뮬레이션(GCMC)을 사용하여 이산화탄소에 대한 MOF의 흡착 용량을 테스트할 수 있습니다. 관련 논문은 "네이처"에 게재되었습니다.

전체 보고서 보기:

https://my5353.com/p30269

3. 프린스턴대, 플라즈마 찢어짐 위험 300밀리초 미리 예측하는 AI 컨트롤러 출시

프린스턴 대학의 연구원들은 플라즈마 파괴의 잠재적 위험을 300밀리초 전에 예측하고 적절한 시기에 개입할 수 있는 적응형 예측 및 제어를 위한 AI 컨트롤러를 개발했습니다. 관련 결과는 "Nature"에 게재되었습니다.

전체 보고서 보기:

https://my5353.com/p30296

인기 백과사전 기사

1. 데이터 중력

2. 대규모 멀티태스크 언어 이해(MMLU)

3. 전문가 혼합(MoE)

4. 양자 신경망

5. 신경 복사장(NeRF)

다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

https://hyper.ai/wiki

B 스테이션 생방송 미리보기

날짜시간콘텐츠
3월 25일
월요일
10:0017:00MIT 딥러닝 과정 2020MIT 딥러닝 과정 2021
3월 26일 화요일10:00Python API 개발 - 초보자를 위한 종합 과정
3월 27일 수요일10:0014:00SQL 튜토리얼 - 초보자 과정 생성 AI 전체 과정
3월 28일 목요일21:00초보자를 위한 플러터 코스
3월 29일 금요일10:00초보자를 위한 플러터 코스
3월 30일 토요일10:00하버드 CS50 - 파이썬 인공지능 과정
3월 31일 일요일10:00하루 만에 딥러닝을 위한 PyTorch 배우기

슈퍼 뉴로 TV는 24시간, 주 7일 생중계로 방송됩니다. AI 분야에서 "전자 피클"을 얻으려면 클릭하세요:

http://live.bilibili.com/26483094

위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!

다음주에 뵙겠습니다!

HyperAI 소개

HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.

* 1200개 이상의 공개 데이터 세트에 대한 국내 가속 다운로드 노드 제공

* 300개 이상의 고전적이고 인기 있는 온라인 튜토리얼이 포함되어 있습니다.

* 100개 이상의 AI4Science 논문 사례 해석

* 500개 이상의 관련 용어 검색 지원

* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅

학습 여정을 시작하려면 공식 웹사이트를 방문하세요.

https://hyper.ai/