HyperAI초신경

주커버그는 Meta Connect 2024 기조 연설에서 최초의 멀티모달 대형 모델인 Llama 3.2 비전 출시를 발표했습니다! 이 모델은 11B와 90B의 두 가지 버전으로 출시되었으며, 다양한 모드의 작업을 지원하는 최초의 Llama 시리즈 모델이 되었습니다. 공식 데이터에 따르면, 이 두 오픈소스 모델의 성능은 폐쇄소스 모델의 성능을 능가했습니다.

배포하는 게 기대되네요.우리는 hyper.ai 공식 웹사이트에서 11B 모델에 대한 원클릭 배포 튜토리얼을 즉시 시작했습니다.모두 함께 추론을 경험해 보세요~

온라인으로 실행:https://go.hyper.ai/DKGzm

9월 23일부터 9월 27일까지 hyper.ai 공식 홈페이지가 빠르게 업데이트되었습니다.

* 고품질 공개 데이터 세트: 10

* 엄선된 고품질 튜토리얼: 2개

* 커뮤니티 게시물 선정 : 3개 게시물

* 인기 백과사전 항목: 5개

* 10월 마감일 상위 컨퍼런스: 7개

공식 웹사이트를 방문하세요:하이퍼.AI

선택된 공개 데이터 세트

1. MSEmbGAN 다중 바늘 자수 데이터 세트

이 데이터 세트는 단일 스티치 및 다중 스티치 라벨로 세부적으로 주석이 달린 최초의 자수 데이터 세트입니다. 자수 이미지와 해당 콘텐츠 이미지를 포함한 3만 개 이상의 이미지가 전문 자수 소프트웨어(Wilcom 9.0)를 사용하여 제작되었습니다. 본 논문은 구축된 다중 바늘 자수 데이터 세트를 이 연구 분야의 다른 연구자들에게 제공할 것입니다.

직접 사용:https://go.hyper.ai/urNGE

2. 영화 데이터 세트 영화 정보 데이터 세트

이 데이터 세트에는 전체 MovieLens 데이터 세트에 포함된 45,000개 영화에 대한 자세한 메타데이터가 포함되어 있으며, 이 모든 영화는 2017년 7월 이전에 개봉되었습니다. 이 데이터 세트는 포스터, 배경, 예산, 수익과 같은 영화에 대한 기본 정보뿐만 아니라 개봉일, 언어, 제작 국가, 회사와 같은 자세한 정보도 포함합니다.

직접 사용:https://go.hyper.ai/SDwXX

3. X-Embodiment 실제 로봇 데이터 세트 공개

이 데이터 세트는 21개 기관에서 수집한 단일 팔 로봇부터 양손 로봇, 사족 로봇까지 22가지 로봇 유형의 데이터를 모아 527가지의 다양한 기술과 160,266가지 작업을 포괄합니다. 전 세계 34개 로봇 연구실의 기존 로봇 데이터 세트 60개를 모아서 구축했으며, 다양한 로봇 작업과 환경을 보여줍니다.

직접 사용:https://go.hyper.ai/Cqlw6

4. TMDB 5k 영화 데이터 세트 영화 정보 데이터 세트

이 데이터 세트에는 주로 지난 100년(1916-2017) 동안 미국에서 제작된 5k 영화에 대한 자세한 정보가 포함되어 있습니다. 이 데이터 세트는 연구자와 분석가가 영화 산업의 인기 있는 트렌드와 투자 방향을 알아보는 데 도움을 주고, 영화 산업에 새로 진출하는 기업에 참고할 만한 제안을 제공하도록 설계되었습니다.

직접 사용:https://go.hyper.ai/zaRFY

5. LongCite-45k 대규모 모델 세분화 개선 데이터 세트

이 데이터 세트에는 문장 단위 인용이 포함된 44,600개의 고품질 질의응답 데이터가 포함되어 있으며, 최대 128k 토큰 길이의 긴 텍스트 처리를 지원하고, 사용자가 세분화된 문장 단위 인용을 생성하여 모델의 답변의 정확성을 검증할 수 있도록 합니다.

직접 사용:https://go.hyper.ai/omO5f

6. 전체 TMDB 영화 데이터 세트 2024 영화 데이터 세트

TMDb(The Movie Database)는 포괄적인 영화 데이터베이스입니다. 이 데이터 세트에는 TMDB 데이터베이스의 1,000,000개 영화 컬렉션이 포함되어 있으며, 제목, 등급, 개봉일, 수익, 장르 등의 세부 정보를 포함한 영화에 대한 정보를 제공합니다.

직접 사용:https://go.hyper.ai/r9ks2

7. InfiMM-WebMath-40B 다중 모드 수학적 추론 데이터 세트

이 데이터 세트는 수학적 추론 과제를 위해 특별히 설계된 대규모 오픈 소스 멀티모달 데이터 세트로, 2.4k개의 웹 페이지, 8.5k개의 관련 이미지 URL, 400억 개의 토큰을 포함하고 있으며, 이 모든 것은 CommonCrawl 데이터베이스(2019-2023)에서 신중하게 추출 및 필터링되었습니다.

직접 사용:https://go.hyper.ai/P8m9l

8. VoiceAssistant-400K 음성 지원 최적화 데이터 세트

VoiceAssistant-400K는 음성 지원에 최적화된 데이터 세트입니다. 이 연구의 목적은 음성 지원 서비스를 제공할 때 모델이 생성하는 코드 심볼을 줄이고 실제 응용 프로그램에서 모델의 실용성을 향상시키는 것입니다.

직접 사용:https://go.hyper.ai/KGIM0

9. 역대 최고 5,000개 앨범 음악 앨범 리뷰 데이터 세트

이 데이터 세트에는 다음이 포함됩니다. http://rateyourmusic.com 커뮤니티 사용자들의 투표를 통해 역대 가장 인기 있는 5K 앨범을 선정했습니다. 이 데이터 세트는 2021년 10월 12일에 크롤링되었으며 순위, 앨범 이름, 아티스트 이름, 발매일, 장르, 설명, 평균 평점, 평점 수, 리뷰 수 등의 속성을 포함합니다.

직접 사용:https://go.hyper.ai/c4Olt

10. Spotify 일간 인기곡 200곡 뮤직송 트렌드 데이터 세트

이 데이터 세트에는 2017년부터 2021년까지 전 세계 각 날짜의 Spotify Top 200 노래 목록이 포함되어 있습니다. 이 데이터 세트는 35만 곡이 넘는 노래를 다루며, 연구자와 음악 애호가에게 인기 추세, 음악 선호도 및 기타 관련 연구를 분석하는 데 필요한 풍부한 정보를 제공합니다.

직접 사용:https://go.hyper.ai/afvbK

더 많은 공개 데이터 세트를 보려면 다음을 방문하세요.

https://hyper.ai/datasets

선택된 공개 튜토리얼

1. Llama-3.2-11B-Vision-Instruct의 원클릭 배포

이 모델은 Llama 3.2-Vision 멀티모달 대형 모델 패밀리의 11B 매개변수 크기이며, 고해상도 이미지 입력(1120×1120픽셀)을 지원하고, 기본 모델 완성 및 지침 조정의 채팅 변형과 함께 교차 어텐션 메커니즘을 사용합니다. 공식 웹사이트로 가서 컨테이너를 복제하고 시작한 후, API 주소를 직접 복사하면 모델의 추론을 경험할 수 있습니다.

직접 사용:https://go.hyper.ai/DKGzm

2. ComfyUl Littletinies 동화 일러스트 생성 데모

이 모델은 텍스트 프롬프트를 기반으로 손으로 그린 만화 스타일의 이미지를 생성할 수 있습니다. 이 모델은 고전적인 만화적 미학을 바탕으로 기발하고 양식화된 일러스트레이션을 만드는 데 특히 적합하며, 생성된 이미지는 손으로 그린 듯한 질감, 매끄러운 붓놀림, 부드러운 색상을 가지고 있습니다. 모델과 환경이 배포되었으며, 튜토리얼 지침에 따라 추론을 생성할 수 있습니다.

직접 사용:https://go.hyper.ai/YHu0a

또한, 우리는 안정적 확산 튜토리얼 교환 그룹도 만들었습니다. 친구들을 환영합니다. QR 코드를 스캔하고 [SD 튜토리얼]에 댓글을 남겨 그룹에 가입하여 다양한 기술 문제를 논의하고 신청 결과를 공유하세요~

커뮤니티 기사

1. 자수 패턴을 지능적으로 생성할 수 있습니다! 우한 섬유대학 시각 컴퓨팅 및 디지털 섬유팀은 세계 최고 저널 TVCG에 채택된 최초의 다중 스티치 자수 생성적 적대 네트워크 모델을 발표했습니다.

우한 방직 대학 컴퓨터 및 인공지능 학부의 후신롱 연구 그룹은 다중 스티치 자수 생성적 적대 네트워크 모델인 MSEmbGAN을 제안하여 현재 가장 큰 자수 데이터 세트를 만들었습니다. 관련 논문은 최고 학술지인 TVCG에도 게재되었습니다. 본 논문은 논문에 대한 자세한 해석과 공유입니다.

전체 요약을 확인하세요:https://go.hyper.ai/5t8NQ

2. 권위 있는 저널 Cell Discovery에 새로운 연구 결과가 실렸습니다! 상하이 교통대학교의 Hong Liang이 이끄는 팀은 기능성 단백질의 초저가 및 완전 자동 설계를 위한 CPDiffusion 모델을 제안했습니다.

상하이 교통대학의 홍량(Hong Liang) 연구팀은 매우 낮은 학습 비용과 데이터 비용으로 단백질 서열, 구조, 기능 간의 암묵적 매핑 관계를 학습할 수 있는 확산 확률 모델 프레임워크를 설계하여 다양한 단백질 서열을 생성했습니다. 본 논문은 논문에 대한 자세한 해석과 공유입니다.

전체 보고서 보기:https://go.hyper.ai/ziRvz

3. ECCV 2024에 선정되었습니다! MIT는 54,000개 이상의 이미지를 포괄하는 의료 이미지 분할을 위한 일반 모델인 ScribblePrompt를 제안했으며 이는 SAM보다 성능이 뛰어납니다.

MIT 컴퓨터 과학 및 인공지능 연구실의 한 팀은 매사추세츠 종합병원과 하버드 의대의 연구자들과 협력하여 대화형 생물의학 이미지 분할을 위한 일반 모델인 ScribblePrompt를 제안했습니다. ScribblePrompt는 신경망 기반 분할 도구로, 그래피티, 클릭, 경계 상자와 같은 다양한 주석 방법을 사용하는 주석 작성자가 훈련되지 않은 레이블과 이미지 유형에 대해서도 생물의학 이미지 분할 작업을 유연하게 수행할 수 있도록 지원합니다. 본 논문은 논문에 대한 자세한 해석과 공유입니다.

전체 보고서 보기:https://go.hyper.ai/QQjAf

인기 백과사전 기사

1. 시그모이드 함수

2. 대응 t-검정

3. 대조 학습

4. 반지도 학습

5. 데이터 증강

다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

https://go.hyper.ai/wiki

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event

위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!

다음주에 뵙겠습니다!

HyperAI 소개

HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.

* 1300개 이상의 공공 데이터 세트에 대한 국내 가속 다운로드 노드 제공

* 400개 이상의 고전적이고 인기 있는 온라인 튜토리얼 포함

* 100개 이상의 AI4Science 논문 사례 해석

* 500개 이상의 관련 용어 검색 지원

* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅

학습 여정을 시작하려면 공식 웹사이트를 방문하세요.

https://hyper.ai

Command Palette

메타의 첫 번째 멀티모달 대형 모델이 클릭 한 번으로 출시됩니다! 최초의 다중 바늘 자수 데이터 세트가 온라인에 공개되었으며, 30,000개 이상의 이미지가 포함되어 있습니다.