HyperAI초신경

AAAI'25 제출 마감일이 오늘입니다! SD 핵심 멤버들은 Midjourney보다 더 강력한 텍스트 기반 그래프 모델을 오픈 소스로 공개했으며 이제 원클릭으로 시작할 수 있습니다.

特色图像

미드저니는 더 이상 인기가 없어요! 6월에 Stable Diffusion 3가 오픈 소스로 출시된 이후, Stability AI의 전 핵심 멤버였던 Robin Rombach는 이번 달 초에 FLUX.1 이미지 생성 모델 제품군을 출시하기 위해 새로운 팀을 이끌었습니다. 관계자는 FLUX.1이 여러 핵심 지표에서 Midjourney v6.0과 DALL·E 3 및 기타 문화 지도의 헤드 모델을 능가하며 오픈 소스라고 주장했습니다. 정말 강력한 것 같아요. 당신도 시도해 보고 싶으신가요?

hyper.ai 공식 웹사이트는 이제 튜토리얼 섹션에서 "FLUX.1-schnell Vincent Figure Demo"를 출시했습니다.클릭 한 번으로 복제하고 재생을 시작하세요. 기사를 아래로 스크롤하여 링크를 확인하세요~

8월 12일부터 8월 16일까지 hyper.ai 공식 웹사이트가 업데이트되었습니다.

* 고품질 튜토리얼 선택: 3개

* 고품질 공개 데이터 세트: 10

* 커뮤니티 기사 선정: 4개 기사

* 인기 백과사전 항목: 5개

* 8월 마감일 상위 컨퍼런스: 2

공식 웹사이트를 방문하세요:하이퍼.AI

선택된 공개 튜토리얼

1. FLUX.1-schnell 빈센트 피규어 데모

FLUX.1은 텍스트 설명으로부터 이미지를 생성할 수 있는 120억 개의 매개변수를 갖춘 대형 모델로, 즉각적인 추적, 시각적 품질, 이미지 세부 정보, 출력 다양성 측면에서 최첨단 결과를 달성합니다. 이 튜토리얼에서는 FLUX.1 [schnell] 버전 모델을 사용합니다. 모델과 환경이 배포되었습니다. 튜토리얼의 지침에 따라 대형 모델을 직접 사용하여 추론을 생성할 수 있습니다.

직접 사용:https://go.hyper.ai/peksE

2. 온라인 튜토리얼 | 전체 그림 그리기 과정을 구현하려면 사진이 1장만 필요합니다. Lvmin Zhang의 새로운 작품 Paints-Undo가 온라인에 공개되었습니다!

ControlNet의 저자 Lvmin Zhang은 Paints-Undo라는 새로운 프로젝트를 개발했습니다. 이 프로젝트는 모든 이미지의 페인팅 과정을 빠르게 분해하여 초보자가 다양한 스타일의 이미지 페인팅 기법을 더 잘 이해하는 데 도움을 줍니다. HyperAI는 이제 "한 장의 사진에서 생성된 전체 페인팅 과정의 페인트 취소 데모"를 출시했습니다. 이 튜토리얼은 모든 사람을 위한 환경을 구축했습니다. 어떤 명령도 입력할 필요 없이, 한 번의 클릭으로 복제를 시작할 수 있습니다!

직접 사용:https://go.hyper.ai/EwBE0

3. Puke 화학 대형 모델 ChemLLM-7B-chat 데모의 원클릭 배포

ChemLM-7B-Chat은 상하이 인공지능연구소(Shanghai AI Laboratory)에서 2024년에 오픈 소스로 공개한 화학 및 분자 과학을 위한 최초의 오픈 소스 대규모 언어 모델인 "Puke Chemistry(ChemLLM)"입니다. 이 튜토리얼은 모델을 한 번의 클릭으로 배포하는 데모입니다. 컨테이너를 복제하고 시작하고, 생성된 API 주소를 직접 복사하기만 하면 모델의 추론을 경험할 수 있습니다.

직접 사용:https://go.hyper.ai/X8V9z

선택된 공개 데이터 세트

1. ChemData 화학 작업 데이터 세트

이 데이터 세트는 상하이 인공지능 연구소에서 최초의 과학적 빅 모델인 푸커 화학 빅 모델(ChemLLM)과 함께 오픈 소스로 공개되었습니다. 여기에는 주로 9가지 핵심 화학 과제, 73만 개의 고품질 질문과 답변, 대규모 언어 모델, 화학 능력 교육 미세 조정 데이터 세트가 포함됩니다.

직접 사용:https://go.hyper.ai/94tF1

2. ChemBench4K 화학 능력 평가 벤치마크 데이터 세트

이 데이터 세트는 4,100개의 객관식 문제를 포함하여 화학 분자와 반응에 대한 9개의 과제로 구성되어 있습니다. 이 벤치마크는 대규모 언어 모델의 화학적 수준을 객관적으로 측정할 수 있는 기반을 마련합니다.

직접 사용:https://go.hyper.ai/itsdU

3. BRIGHT 텍스트 검색 벤치마크 데이터 세트

이 데이터 세트는 다양한 분야(StackExchange, LeetCode, 수학 경시대회)에서 수집한 1,385개의 실제 쿼리를 포함하고 있으며, 이는 모두 실제 인공 데이터에서 나왔습니다. BRIGHT 데이터 세트는 검색 시스템이 이러한 깊은 논리적 관계를 식별하고 관련 학술 기사나 보고서를 찾을 수 있는지 여부를 테스트하기 위해 특별히 설계되었습니다.

직접 사용:https://go.hyper.ai/s735d

4. 다중 모드 ArXiv 과학적 이해 데이터 세트

멀티모달 ArXiv는 LVLM에 대한 과학적 이해를 높이기 위해 ArXivCap과 ArXivQA로 구성되어 있습니다. ArXivCap은 640만 개의 이미지와 390만 개의 캡션을 포함하는 그래프 캡션 데이터 세트입니다. ArXivQA는 GPT-4V가 프롬프트를 통해 과학적 그래프를 기반으로 생성한 질의응답 데이터 세트입니다. 해당 결과는 ACL 2024에서 승인되었습니다.

직접 사용:https://go.hyper.ai/n64Jh

5. SPIQA 다중 모달 과학 논문 질의응답 데이터세트

이는 다양한 컴퓨터 과학 분야의 과학 연구 기사에 있는 복잡한 수치와 표를 해석하기 위해 특별히 설계된 최초의 대규모 QA 데이터 세트입니다. 여기에는 훈련, 검증 및 3가지 평가 부분으로 나뉜 27만 개의 질문이 포함되어 있습니다. 연구팀은 12개의 잘 알려진 기본 모델에 대한 광범위한 실험을 수행하여, 현재 다중 모드 시스템이 연구 논문의 미묘한 측면을 이해하는 능력을 평가했습니다.

직접 사용:https://go.hyper.ai/qd7I2

6. MMEvaIPro 다중 모드 벤치마크 평가 데이터 세트

MMEvalPro는 두 개의 "앵커" 질문(1개의 인식 질문과 1개의 지식 질문)을 추가하여 기존 평가 방법을 개선하고, 모델의 다중 모드 이해의 다양한 측면을 테스트하는 "세 개의 질문"을 구성합니다. 최종 벤치마크에는 2,138개의 3중 문제가 포함되어 있으며, 총 6,414개의 문제가 다양한 주제와 난이도를 다루고 있습니다.

직접 사용:https://go.hyper.ai/Hw8JA

7. PubMedVision 대규모 의료 VQA 데이터 세트

PubMedVision은 대규모의 고품질 의료 다중 모드 데이터 세트입니다. 연구팀은 정교한 데이터 처리 방법을 사용하여 PubMed 국제 의학 저널에 게재된 논문에서 의학 관련 이미지와 유익한 이미지 설명을 걸러냈고, 이를 통해 의학과 관련 없는 이미지와 맥락과 관련 없는 콘텐츠를 대량으로 효과적으로 걸러냈습니다.
직접 사용:https://go.hyper.ai/Uy8XM

8. 다중 모달 자기 지시 다중 모달 벤치마크 데이터 세트

이 데이터 세트에는 대시보드, 로드맵, 차트, 표, 흐름도, 관계도, 시각적 퍼즐, 2D 평면도를 포함한 8개 주요 범주를 포괄하는 관련 질문이 있는 총 11,193개의 추상 이미지가 포함되어 있으며, 모델을 세부적으로 조정하기 위한 추가 데이터 62,476개도 포함되어 있습니다.

직접 사용:https://go.hyper.ai/FwGuz

9. Assetto Corsa Gym 대규모 자율 주행 시뮬레이션 벤치마크

이 데이터 세트는 6,400만 단계의 레이싱 주행 데이터를 수집하는데, 그 중 230만 단계는 다양한 주행 기술을 가진 인간 운전자의 데이터이고 나머지는 SAC(Soft Actor-Critic) 정책의 데이터입니다.

직접 사용:https://go.hyper.ai/6tfuM

10. MiraData: 장시간 및 구조화된 자막을 갖춘 대규모 비디오 데이터 세트

MiraData는 1~2분(평균 길이 72.1초) 분량의 무편집 비디오 클립에 초점을 맞추고 있으며, 각 비디오에는 다양한 각도에서 본 구조화된 설명이 함께 제공됩니다. 설명의 평균 길이는 318단어입니다. 이를 통해 비디오 콘텐츠의 포괄적인 프레젠테이션이 보장됩니다. 이 데이터 세트는 긴 비디오 생성, 비디오 콘텐츠 이해 및 생성 분야의 연구자들에게 귀중한 리소스와 새로운 과제를 제공합니다.

직접 사용:https://go.hyper.ai/2LmEJ

더 많은 공개 데이터 세트를 보려면 다음을 방문하세요.

https://hyper.ai/datasets

커뮤니티 기사

1. ACL 2024 최우수 논문 7편 발표, HUST 학부생 1저자상 수상

8월 14일, ACL 2024의 각종 상이 하나씩 발표되었습니다. 총 7개의 결과가 최우수 논문상을 수상했습니다. 화중과학기술대학교, 애들레이드대학교, 안양사범대학교, 남중국이공대학교가 공동으로 출판한 "확산 모델을 통한 오라클 뼈 언어 해독"이 수상했습니다. HyperAI 슈퍼 신경망은 모든 사람에게 자세한 해석을 제공했습니다.

전체 보고서 보기:https://go.hyper.ai/t5Zon

2. MIT/CETI 팀이 머신러닝을 사용하여 향유고래 발음 알파벳을 분리했습니다! 인간의 언어 체계와 매우 유사하며, 정보 전달 능력이 더 뛰어납니다!

최근 MIT의 프라튜샤 샤르마와 CETI의 연구진은 머신 러닝을 사용하여 향유고래의 녹음을 분석한 결과, 향유고래가 내는 소리가 다양한 특징의 조합으로 구조화되고 형성된다는 것을 확인했습니다. 또한 그들은 인간의 언어 표현 체계와 매우 유사한 향유고래 발음 알파벳을 분리해냈습니다. 본 논문은 연구논문을 자세히 해석하고 공유하는 것입니다.

전체 보고서 보기:https://go.hyper.ai/nA23S

3. 국내 광칩 기술 혁신 성공! 청화대 연구팀은 신경망을 사용하여 최초의 풀포워드 지능형 광 컴퓨팅 훈련 아키텍처를 구축했습니다.

최근, 청화대학교의 다이 치옹하이(Dai Qionghai) 원사와 방루(Fang Lu) 교수 연구팀은 광자 전파의 대칭성을 포착하여 신경망 학습에서의 전방 전파와 후방 전파를 빛의 전방 전파와 동일시하고, 완전한 전방 모드 학습 방법을 개발했습니다. 본 논문은 연구논문을 자세히 해석하고 공유하는 것입니다.

전체 보고서 보기:https://go.hyper.ai/lxNhj

4. 물질탐험의 새로운 시대! 청화대학교의 쉬융(Xu Yong)과 돤원후이(Duan Wenhui) 연구팀은 전자 구조 예측의 블랙박스를 여는 신경망 밀도 함수 프레임워크를 공개했습니다!

신경망 알고리즘과 DFT 알고리즘을 보다 유기적으로 결합하기 위해 청화대학교의 쉬융(Xu Yong)과 돤원후이(Duan Wenhui) 연구진은 신경망 밀도 함수 이론(신경망 DFT) 프레임워크를 제안했습니다. 이 프레임워크는 신경망의 손실 함수 최소화와 밀도 함수 이론의 에너지 함수 최적화를 통합합니다. 기존의 지도학습 방법과 비교했을 때 정확도와 효율성이 더 높고, 딥러닝 DFT 방법 개발을 위한 새로운 길을 열었습니다. 본 논문은 연구논문을 자세히 해석하고 공유하는 것입니다.
전체 보고서 보기:https://go.hyper.ai/oE7nH

인기 백과사전 기사

1. 대응 t-검정

2. 상호 정렬 융합 RRF

3. 파레토 전선

4. 대규모 멀티태스크 언어 이해(MMLU)

5. 데이터 증강

다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

https://go.hyper.ai/wiki

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event

위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!

다음주에 뵙겠습니다!

HyperAI 소개

HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.

* 1300개 이상의 공공 데이터 세트에 대한 국내 가속 다운로드 노드 제공

* 400개 이상의 고전적이고 인기 있는 온라인 튜토리얼 포함

* 100개 이상의 AI4Science 논문 사례 해석

* 500개 이상의 관련 용어 검색 지원

* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅

학습 여정을 시작하려면 공식 웹사이트를 방문하세요.

https://hyper.ai