HyperAI초신경

999달러의 가치! Apache CoC 컨퍼런스에 무료 티켓 제공; 대규모 모델의 시간 추론을 위한 새로운 벤치마크 데이터 세트 출시

特色图像

Apache는 7월 26일부터 28일까지 항저우에서 CommunityOverCode Asia 2024(CoC)를 개최합니다. 이 컨퍼런스에서는 Apache 커뮤니티 구축 및 개발에 관한 최신 정보와 첨단 실무 사례를 소개합니다. HyperAI는 협력 커뮤니티로서 컨퍼런스에 참석하도록 초대되었습니다. 우리는 현장에 있는 모든 분들을 위해 흥미로운 체크인 액티비티와 풍성한 선물을 준비했습니다. 부스에서 소통하는 모든 분들을 환영합니다~

복지가 온다!우리는 당신을 위해 999위안 상당의 이벤트 티켓 5장을 준비했습니다.상품은 추첨을 통해 분배됩니다. "HyperAI Super Neural" 공식 계정을 팔로우하면 추첨에 참여할 수 있습니다.

7월 15일부터 7월 19일까지 hyper.ai 공식 웹사이트가 업데이트되었습니다.

* 고품질 공개 데이터 세트: 10

* 엄선된 고품질 튜토리얼: 2개

* 커뮤니티 기사 선정: 4개 기사

* 인기 백과사전 항목: 5개

* 8월 마감일 상위 컨퍼런스: 4

공식 웹사이트를 방문하세요:하이퍼.AI

선택된 공개 데이터 세트

1. 대규모 모델 시간 추론 기능을 위한 시간 테스트 벤치마크 데이터 세트

이 데이터 세트는 ToT로 불리며 세 개의 하위 세트로 나뉩니다. ToT-semantic에는 1,850개의 예가 포함되어 있고, ToT-arithmetic에는 2,800개의 예가 포함되어 있으며, ToT-semantic-large에는 46,480개의 예가 포함되어 있습니다. ToT는 LLM의 시간적 이해 능력과 산술 능력을 각각 검사합니다.

직접 사용:https://go.hyper.ai/D5089

2. VEGA 과학 논문 그래픽 및 텍스트 데이터 세트

이 데이터 세트에는 50,000개 이상의 과학 논문에서 발췌한 텍스트와 이미지 데이터가 포함되어 있으며, 텍스트와 이미지를 섞어서 읽는 작업을 위해 특별히 구성되었습니다.

직접 사용:https://go.hyper.ai/DMmWq

3. 레몬 품질 관리 데이터 세트

이 데이터 세트에는 주석이 달린 이미지 2,690개(1,056 x 1,056픽셀)가 포함되어 있으며, 과일 품질 관리 업무를 연구하는 데 사용할 수 있습니다.

직접 사용:https://go.hyper.ai/03ytr

4. GDHY 1981-2016 세계 주요 작물 역사적 수확량 데이터 세트

이 데이터 세트는 1981년부터 2016년까지 전 세계 주요 작물의 과거 수확량 데이터를 제공합니다. 기후 변화가 작물 수확량에 미치는 영향을 분석하고, 글로벌 그리드 작물 모델 시뮬레이션을 평가하고, 글로벌 및 계절별 작물 예측 시스템의 기초를 제공하는 데 매우 유용합니다.

직접 사용:https://go.hyper.ai/xNzH3

5. WHU-OHS 대규모 스펙트럼 이미지 분류 벤치마크 데이터 세트

이 데이터 세트는 중국 내 40곳 이상의 다양한 위치를 담은 42개의 OHS 위성 이미지로 구성되어 있습니다. 훈련 세트, 검증 세트, 테스트 세트에는 각각 4,822개, 513개, 2,460개의 하위 이미지가 있습니다.

직접 사용:https://go.hyper.ai/OFxxR

6. VISO 대규모 위성 비디오 이동 표적 감지 및 추적 데이터 세트

이 데이터 세트는 지린-1 위성 플랫폼이 촬영한 12,000×5,000픽셀의 고해상도 비디오로 구성되어 있습니다. 이 프로젝트의 목표는 위성 비디오 분석 분야의 기술 발전을 촉진하고 작은 대상 크기, 낮은 공간 해상도, 제한된 모양과 질감 정보 등의 과제를 해결하는 것입니다.

직접 사용:https://go.hyper.ai/LcMbH

7. SAT-DS 대규모 3D 의료 영상 분할 데이터 세트

이 데이터 세트는 현재 가장 큰 3D 의료 이미지 분할 데이터 세트입니다. 이 솔루션은 72개의 공개 데이터 세트, CT, MR, PET의 세 가지 모드에서 얻은 22,000개 이상의 이미지, 302,000개 이상의 분할 주석을 하나로 모아 인체의 8개 주요 부위에서 497개의 분할 대상을 포괄하며, 텍스트 프롬프트를 통해 방사선 이미지의 일반적인 의료 분할 모델을 구현합니다.

직접 사용:https://go.hyper.ai/aANbx

8. GAIA 일반 AI 어시스턴트 벤치마크 데이터세트

GAIA는 다양한 수준의 도구와 자율성을 필요로 하는 명확한 답변이 있는 450개 이상의 복잡한 질문으로 구성되어 있습니다. 따라서 3개 레벨로 나뉘는데, 레벨 1은 매우 뛰어난 LLM으로 정복할 수 있는 반면, 레벨 3은 모델 역량이 크게 향상되었음을 나타냅니다. 각 레벨은 검증을 위한 완전히 공개된 개발 세트와 비공개 답변 및 메타데이터가 포함된 테스트 세트로 나뉩니다.

직접 사용:https://go.hyper.ai/VY3cU

9. 헬멧 감지 헬멧 감지 데이터 세트

이 데이터 세트에는 헬멧 감지 작업에 사용할 수 있는 "헬멧 착용"과 "헬멧 미착용"의 두 가지 범주에 대한 764개의 이미지가 포함되어 있습니다.

직접 사용:https://go.hyper.ai/QuMyR

10. 토양 수분 초분광 벤치마크 데이터 세트

이 데이터 세트는 초분광 데이터를 기반으로 한 토양 수분 평가를 위한 벤치마크 데이터 세트입니다. 이는 독일 카를스루에에서 5일간의 현장 측정 캠페인을 통해 얻은 결과입니다. 초분광 데이터를 기반으로 토양 수분 함량을 추정할 수 있는 모델을 연구하고 개발하는 것을 목표로 합니다.

직접 사용:https://go.hyper.ai/fG77T

더 많은 공개 데이터 세트를 보려면 다음을 방문하세요.

https://hyper.ai/datasets

선택된 공개 튜토리얼

1. Tencent HunyuanDiT Wenshengtu 데모

이 모델은 최초의 중국어-영어 이중 언어 DiT 아키텍처로, Diffusion 변환기를 기반으로 한 텍스트-이미지 생성 모델로, 중국어와 영어에 대한 세밀한 이해 기능을 갖추고 있습니다. 연구팀은 모델 최적화 반복을 지원하기 위해 데이터를 업데이트하고 평가하는 완전한 데이터 파이프라인을 구축했습니다. 이 튜토리얼에서는 어떤 명령도 입력할 필요가 없으며, 한 번의 클릭으로 복제하여 즉시 이미지 생성을 시작할 수 있습니다.

온라인으로 실행:https://go.hyper.ai/Dwtf7

2. Paints-Undo 하나의 그림에서 그림을 생성하는 전체 프로세스의 데모

PaintsUndo는 인간의 그림 그리기 행동을 시뮬레이션할 수 있는 모델입니다. 인간의 그림 그리기 행동에 대한 기본 모델을 제공하는 것을 목표로 합니다. 동시에, 미래의 AI 모델이 인간 예술가들의 실제적 요구를 더 잘 충족시킬 수 있기를 기대합니다. 이 프로젝트는 이미지를 입력으로 받아 해당 이미지의 일련의 그림을 출력하는 일련의 모델을 제공합니다. 이 튜토리얼은 PaintsUndo를 한 번의 클릭으로 실행하는 데모입니다. 관련 환경과 종속성이 설치되었습니다. 한 번의 클릭으로 복제하고 시작하여 체험해 볼 수 있습니다.

온라인으로 실행:https://go.hyper.ai/Nr3DC

또한, 우리는 안정적 확산 튜토리얼 교환 그룹도 만들었습니다. 친구들을 환영합니다. QR 코드를 스캔하고 [SD 튜토리얼]에 댓글을 남겨 그룹에 가입하여 다양한 기술 문제를 논의하고 신청 결과를 공유하세요~

커뮤니티 기사

1. 신경망은 밀도 함수 이론을 대체합니다! 칭화대 연구팀, 범용 소재 모델 DeepH 출시, 초정밀 예측 달성

청화대학교 연구진은 원래의 DeepH 방법을 사용하여 DeepH 범용 재료 모델을 개발하고 "대형 재료 모델"을 구축하기 위한 실행 가능한 솔루션을 시연했습니다. 이 획기적인 발견은 혁신적인 소재 발견에 새로운 기회를 제공합니다. 본 논문은 논문의 해석과 공유입니다.

전체 보고서 보기:https://go.hyper.ai/lxFha

2. 대체가 아닌, 공생! 기상과학의 미래에는 AI와 수치예보의 유기적 결합이 필요합니다.

AI의 급속한 발전에 따라 "기존 수치 예측이 AI에 따라잡을 수 있을까, 능가할 수 있을까, 아니면 완전히 대체될 수 있을까? 두 가지가 어떻게 공존할 수 있을까?"라는 질문이 제기되고 있습니다. 최근 몇 년 동안 사람들의 관심과 생각을 불러일으켰습니다. 이와 관련하여 중국 기상청 상하이 태풍연구소 황웨이 부소장은 "예측 가능한 미래에는 AI 기상 예보와 전통적인 수치 예보를 유기적으로 결합하는 것이 예보 기술에서 획기적인 발전을 이루는 가장 효과적인 방법"이라고 생각합니다. 이 글은 HyperAI가 두 가지의 관계를 해석하고 공유하는 글입니다.

전체 보고서 보기:https://go.hyper.ai/ui8Yv

3. ICML에 선정되었습니다! 인민대학교 연구팀은 등가 그래프 신경망을 사용하여 표적 단백질 결합 부위를 예측했으며, 20%의 성능이 가장 크게 향상되었습니다.

중국 인민대학교 가오링 인공지능학원 연구팀은 E(3) 등변 그래프 신경망(GNN)을 리간드 결합 부위 예측에 처음으로 적용하고 CNN 기반 방법에서 발생하는 과제를 해결하는 EquiPocket이라는 프레임워크를 제안했습니다. 본 논문은 연구과정에 대한 해석과 공유입니다.

전체 보고서 보기:https://go.hyper.ai/HrzK4

4. 스탠포드, 애플 등 23개 기관이 DCLM 벤치마크를 발표했습니다. 고품질 데이터 세트가 스케일링 법칙을 뒤흔들 수 있을까? 기본 모델은 Llama3 8B와 동일한 성능을 보입니다.

언어모델 학습에 필요한 데이터 양의 지속적인 증가와 데이터 품질 등의 이슈에 대응하여 스탠포드, 애플 등 23개 기관이 DCLM 벤치마크 테스트를 발표, 240조 개의 데이터를 정리했습니다. 이 글은 실험 과정에 대한 해석과 공유입니다.

전체 보고서 보기:https://go.hyper.ai/V3gPg

인기 백과사전 기사

1. 스케일링 법칙

2. 마스크드 언어 모델링(MLM)

3. 데이터 증강

4. 장기 단기 기억 단기 기억

5. 양자 신경망

다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

https://go.hyper.ai/wiki

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event

위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!

다음주에 뵙겠습니다!

복지 활동
CommunityOverCode 2024 컨퍼런스(약칭 CoC)가 7월 26일부터 28일까지 항저우에서 개최됩니다. 이 컨퍼런스는 오픈 소스 기술 개발과 커뮤니티 참여를 촉진하는 것을 목표로 하는 Apache 소프트웨어 재단(ASF)의 공식 글로벌 컨퍼런스 시리즈입니다. HyperAI는 협력 커뮤니티로서 이 이벤트에 참여할 예정이며, 오프라인에서 여러분을 만나 뵙기를 기대합니다!

"HyperAI Super Neural" 공개 계정을 팔로우하여 경품 추첨에 참여해 보세요.999위안 상당의 이벤트 티켓을 얻을 수 있는 기회를 잡으세요!