HyperAI초신경

‍‍작은 모델이 다시 말려졌습니다! 마이크로소프트가 오픈소스를 3개 발표했습니다! Phi 3.5는 한 번에 다양한 작업에 맞는 3가지 모델을 출시했으며, 여러 벤치마크에서 다른 유사 모델을 능가했습니다.

이 중 Phi-3.5-mini-instruct는 메모리나 컴퓨팅 성능이 제한된 장치를 위해 특별히 출시되었습니다. 작은 매개변수에도 강력한 추론 능력을 발휘할 수 있으며, 코드 생성, 다국어 이해 등의 작업을 쉽게 처리할 수 있습니다. Phi-3.5-vision-instruct는 멀티모달 분야의 선두주자로, 텍스트와 시각 정보를 동시에 처리할 수 있으며 이미지 이해 및 비디오 요약과 같은 작업을 쉽게 처리할 수 있습니다.

HyperAI Super Neural Network는 이제 미니 버전과 비전 버전에 대한 모델 배포 튜토리얼을 출시했습니다. 아래로 스크롤하여 링크를 받으세요~

9월 2일부터 9월 6일까지 hyper.ai 공식 웹사이트가 업데이트됩니다.

* 고품질 튜토리얼 선택: 3개

* 고품질 공개 데이터 세트: 10

* 커뮤니티 게시물 선정 : 3개 게시물

* 인기 백과사전 항목: 5개

* 9월 마감일 상위 컨퍼런스: 5개

공식 웹사이트를 방문하세요:하이퍼.AI

저는 여러분께 온라인 학술 공유 활동을 추천하고 싶습니다.상하이 교통대학교의 박사후 연구원인 저우쯔이는 "단백질 언어 모델을 위한 소규모 표본 학습 방법"이라는 제목으로 발표할 예정입니다.실용적인 정보 공유를 원하시면, 클릭하여 시청 예약을 하세요⬇️

https://hdxu.cn/6Bjom

선택된 공개 튜토리얼

1. Phi-3.5-mini-instruct의 원클릭 배포

Phi-3.5-mini-instruct는 128K 토큰의 컨텍스트 길이를 지원하며 코드 생성, 수학적 문제 해결, 논리 기반 추론과 같은 작업에 적합합니다. 이 모델은 다국어 및 여러 차례 대화하는 작업에서 좋은 성과를 보이며, RepoQA 벤치마크에서 동일 수준의 다른 모델을 능가합니다. 이 튜토리얼은 모델을 한 번의 클릭으로 배포하는 데모입니다. 컨테이너를 복제하고 시작하고, 생성된 API 주소를 직접 복사하기만 하면 모델의 추론을 경험할 수 있습니다.

직접 사용:https://go.hyper.ai/F7smR

2. Phi-3.5-vision-instruct의 원클릭 배포

Phi-3.5-vision-instruct 모델은 이미지 이해, 광학 문자 인식(OCR), 차트 및 표 분석, 여러 이미지 또는 비디오 클립 요약 등 광범위한 기능을 갖추고 있어 다양한 AI 기반 애플리케이션에 적합합니다. 이미지 및 비디오 처리와 관련된 벤치마크에서 상당한 성능 향상을 보였습니다. 모델과 환경이 배포되었습니다. 튜토리얼의 지침에 따라 대형 모델을 직접 사용하여 추론을 생성할 수 있습니다.

직접 사용:https://go.hyper.ai/zN9Bx

3. 온라인 튜토리얼 | 1분 안에 10,000단어 분량의 서스펜스 소설을 제작하세요. LongWriter-glm4-9b는 긴 텍스트 출력의 병목 현상을 해소합니다.

LongWriter는 청화대학교에서 개발한 오픈 소스 프로젝트로, 장문 컨텍스트 대규모 언어 모델(LLM)을 사용하여 매우 긴 텍스트(10,000단어 이상)를 생성합니다. 이 튜토리얼은 모델을 한 번의 클릭으로 배포하는 데모입니다. 컨테이너를 복제하고 시작하고, 생성된 API 주소를 직접 복사하기만 하면 모델의 추론을 경험할 수 있습니다.

직접 사용:https://go.hyper.ai/p6SiO

선택된 공개 데이터 세트

1. MRR-Benchmark 다중 모드 판독 벤치마크 데이터 세트

다중 모드 독해(MMR) 벤치마크에는 텍스트, 글꼴, 시각적 요소, 경계 상자, 공간 관계, 기준 진실을 포함하는 11가지 작업에서 주석이 달린 550개의 질문-답변 쌍이 포함되어 있으며, 잘 설계된 평가 지표가 포함되어 있습니다.

직접 사용:https://go.hyper.ai/deAmf

2. EveDentify 동공 직경 추정 데이터 세트

이 데이터 세트에는 51명의 참가자에 대한 총 212,073개의 이미지가 포함되어 있습니다. 연구팀은 Tobii 눈 추적기를 사용하여 얼굴 영상을 촬영하는 동시에 내장 웹캠을 사용하여 동공 직경을 정확하게 측정했습니다. 이 데이터 세트는 일반 웹캠 이미지를 사용하여 동공 직경을 추정하는 데 사용할 수 있는 데이터 세트가 부족하다는 문제를 해결하는 것을 목표로 합니다.

직접 사용:https://go.hyper.ai/iHjxC

3. 교통 도로 객체 감지 폴란드 교통 도로 객체 감지 데이터 세트

이 데이터 세트에는 폴란드 도로의 주석이 달린 11,000개의 이미지가 포함되어 있으며, 객체 감지 작업을 위해 특별히 큐레이팅되었습니다. 데이터는 주로 크라쿠프의 폴란드 도로에 설치된 차량 카메라를 이용해 수집되었습니다. 이 이미지에는 다양한 도로 유형과 다양한 조명 조건(주간 및 야간)을 포함한 다양한 장면이 담겨 있습니다.

직접 사용:https://go.hyper.ai/Sl0k5

4. 재난 시나리오에서의 C2A 인간 감지 데이터 세트

C2A(애플리케이션과 결합) 데이터 세트에는 4가지 재난 현장 유형(화재/연기, 홍수, 건물 붕괴/잔해, 교통사고)과 5가지 인간 자세 범주(구부리기, 무릎 꿇기, 눕기, 앉기, 똑바로 서기)에 대한 총 10,215개의 고해상도 이미지가 포함되어 있으며, 이미지 해상도는 123×152픽셀에서 5184×3456픽셀까지이며, 360,000개 이상의 주석이 달린 인간 인스턴스가 있습니다.

직접 사용:https://go.hyper.ai/15dMR

5. 피부 상태 이미지 데이터 세트 6개의 피부 상태 데이터 세트

이 데이터 세트에는 여드름, 암, 습진, 각질화, 밀리아, 장미진 등 6가지 피부 질환에 대한 강화된 이미지가 포함되어 있습니다. 각 카테고리에는 399개의 이미지가 포함되어 있으며, 총 이미지는 2,394개입니다.

직접 사용:https://go.hyper.ai/tWO7x

6. 펜-푸단 보행자 감지 및 분할 데이터 세트

이 데이터 세트에는 비디오 시퀀스에서 캡처한 170개의 고해상도 RGB 이미지가 포함되어 있으며, 각 이미지에는 0~6개의 보행자 표적이 있습니다. 각 보행자의 위치는 직사각형 상자(마스크)로 정확하게 표시되며, 이를 통해 경계 상자 좌표 정보를 제공하여 객체 감지 훈련과 테스트를 용이하게 합니다.

직접 사용:https://go.hyper.ai/1CqaN

7. Tecnalia 전기 장비 폐기물 초분광 데이터 세트

Tecnalia 초분광 데이터 세트에는 구리, 황동, 알루미늄, 스테인리스 스틸, 구리니켈 등 전기 및 전자 장비 폐기물에서 나온 다양한 비철 금속 분획이 포함되어 있으며, 이미지에는 스펙트럼 범위[415.05nm, 1008.10nm]에 균일하게 분포된 76개의 파장이 포함되어 있습니다.

직접 사용:https://go.hyper.ai/1TBGz

8. 자동차 충돌 예측 자동차 충돌 또는 예측 데이터 세트

이 데이터 세트에는 10,000개의 대시캠 이미지가 포함되어 있으며, 모두 100,000개의 대시캠 비디오에서 가져온 것입니다. 이미지는 5초 간격으로 비디오에서 개별 프레임으로 분리되며, 데이터 세트에는 충돌과 충돌 없음의 두 가지 클래스가 포함됩니다. xlsx 파일에는 주석도 제공됩니다.

직접 사용:https://go.hyper.ai/jV1hL

9. PKU-Market-PCB 인쇄 회로 기판 결함 데이터 세트

PKU-Market-PCB는 6가지 유형의 결함(누출 구멍, 쥐 물림, 개방, 단락, 스트레이, 스트레이 구리)을 포함한 1,386개의 이미지가 포함된 공개 합성 PCB 데이터 세트로, 이미지 감지, 분류 및 등록 작업에 사용할 수 있습니다.

직접 사용:https://go.hyper.ai/VnbpT

10. PKU-Market-Phone 모바일폰 화면 표면 결함 분할 데이터 세트

이 데이터 세트에는 오일 얼룩, 긁힘, 반점 등 3가지 유형의 표면 결함이 포함되어 있습니다. 각 결함 유형별로 400개의 이미지가 있으며, 총 1.2k개의 이미지가 있습니다. 연구팀은 산업 환경을 시뮬레이션하기 위해 이러한 결함을 만들어냈습니다. 이미지는 1920×1080 해상도의 산업용 카메라로 수집되었습니다. 데이터 세트는 학습: 검증: 테스트 = 6:2:2로 나뉘며, 데이터 세트 형식은 PASCAL VOC를 사용합니다.

직접 사용:https://go.hyper.ai/K6u2o

더 많은 공개 데이터 세트를 보려면 다음을 방문하세요.

https://hyper.ai/datasets

커뮤니티 기사

1. 상하이 교통대학교의 Zhong Bozitao가 작성한 AlphaFold 3의 완전한 분해: 원자 정밀도로 모든 생체 분자 구조를 예측하기 위해 데이터를 최대한 활용하지만 완벽하지는 않습니다.

최근 상하이 교통대학교에서 개최된 AI 생명공학 여름학교 행사에서 중보쯔타오 박사는 "알파폴드 3: 원리, 응용 및 전망"이라는 주제로 자신의 학습 경험을 체계적으로 정리하고, 과학 연구 커뮤니티에서 많은 관련 연구 결과를 폭넓게 정리하여 알파폴드 3에 대한 그의 심오한 통찰력을 모든 사람과 공유했습니다. 본 기사는 연설의 핵심 내용을 요약한 것입니다.

전체 보고서 보기:https://go.hyper.ai/Ln2Yv

2. 미국 국립과학원 회보의 표지 기사! 중국팀, 웨이퍼 레벨 생산 가능한 AI 적응형 마이크로 분광기 출시

복단대학교 연구팀은 기존 분광기와 계산 재구성 분광기의 장점을 결합한 새로운 소형 재구성 분광기 설계를 제안했습니다. 통합된 자체 참조 협대역 필터 채널을 통해 인공 지능 알고리즘은 고차원 매개변수 공간에서 스펙트럼 및 알고리즘 매개변수를 동시에 검색할 수 있습니다. 본 논문은 연구논문을 자세히 해석하고 공유하는 것입니다.

전체 보고서 보기:https://go.hyper.ai/GEKE4

3. 상하이 AI 연구소, 700만 건의 질의응답 데이터 처리, GPT-4 수준의 전문 역량 갖춘 ChemLLM 출시

상하이 인공지능 연구소는 화학 대규모 언어 모델 ChemLLM을 출시했습니다. ChemLM은 유창한 대화형 상호작용을 통해 화학 분야에서 다양한 업무를 수행하는 데 탁월하며, 핵심 업무에서는 GPT-4와 동등한 성과를 보이고 있으며, 일반적인 상황에서는 비슷한 규모의 LLM과 비슷한 성과를 보여줍니다. 본 논문은 연구논문을 자세히 해석하고 공유하는 것입니다.

전체 보고서 보기:https://go.hyper.ai/3bdMW

인기 백과사전 기사

1. 상호 정렬 융합 RRF

2. 학습률

3. 핵 규범

4. 파레토 전선

5. 데이터 증강

다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

https://go.hyper.ai/wiki

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event

위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!

다음주에 뵙겠습니다!

HyperAI 소개

HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.

* 1300개 이상의 공공 데이터 세트에 대한 국내 가속 다운로드 노드 제공

* 400개 이상의 고전적이고 인기 있는 온라인 튜토리얼 포함

* 100개 이상의 AI4Science 논문 사례 해석

* 500개 이상의 관련 용어 검색 지원

* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅

학습 여정을 시작하려면 공식 웹사이트를 방문하세요.

https://hyper.ai

Command Palette

한 번의 클릭으로 Phi 3.5 mini+vision을 배포하세요! 다중 모드 독서 벤치마크 데이터 세트인 MRR-Benchmark가 온라인에 있으며 여기에는 550개의 질문-답변 쌍이 포함됩니다.