Microsoft와 Tencent가 기술 분야에서 경쟁하고 있으며, TRELLIS는 3D 생성 분야에서 다양한 포맷을 지원하는 새로운 방향을 선도하고 있습니다. 5천개 이상의 질문에 답변했습니다! VIS-Bench, AI가 '공간 기억'을 학습할 수 있도록 지원

작년 11월, 텐센트는 텍스트와 이미지 모두의 3D 생성을 지원하는 업계 최초의 오픈소스 대형 모델인 Hunyuan3D 생성 모델을 출시했습니다. 한 달도 채 지나지 않아 Microsoft는 3D 자산 생성 분야의 경쟁에 뛰어들기 위해 새로운 프레임워크인 TRELLIS를 출시했습니다. TRELLIS는 방사선장, 3D 가우시안, 메시 등 여러 출력 형식을 지원하여 다양한 요구 사항에 맞춰 최대한의 유연성을 제공합니다.
두 모델 모두 현재 hyper.ai 공식 웹사이트에서 구매 가능합니다. 와서 어느 것이 더 나은지 확인해 보세요.
Hunyuan3D를 온라인으로 사용하세요:https://go.hyper.ai/Rsrno
TRELLIS 온라인 사용:https://go.hyper.ai/JE5s5
1월 6일부터 1월 11일까지 hyper.ai 공식 웹사이트가 업데이트됩니다.
* 고품질 공개 데이터 세트: 10
* 고품질 튜토리얼 선택: 6개
* 커뮤니티 기사 선정: 8개 기사
* 인기 백과사전 항목: 5개
* 1월에 마감일이 있는 주요 컨퍼런스: 7개
공식 웹사이트를 방문하세요:하이퍼.AI
선택된 공개 데이터 세트
1. VSI-Bench 시각적 공간 지능 벤치마크
이 데이터 세트에는 5,000개 이상의 질문-답변 쌍이 포함되어 있으며, 주거지, 사무실, 공장 등 다양한 환경을 포함하는 약 290개의 실제 실내 장면 비디오를 포함하고 있으며, 객체 인식, 위치 관계, 동작 예측 등 여러 문제를 다룹니다.
직접 사용:https://go.hyper.ai/q0DYA

2. 얼굴 특징 추출 데이터 세트 얼굴 특징 추출 데이터 세트
이 데이터 세트는 얼굴의 눈썹, 눈, 코, 입술, 수염 영역을 감지하기 위한 750개의 이미지가 포함된 레이블이 지정된 데이터 세트입니다. 데이터 라벨링 과정은 Roboflow에서 수행되었으며 YOLOv8 형식으로 내보냈습니다.
직접 사용:https://go.hyper.ai/O3kER

3. 감정 및 감정 분석 데이터 세트 감정 및 감정 분석 데이터 세트
이 데이터 세트에는 422,000개의 감정 분석 문장과 보충 자료로 3,309개의 감정 분석 문장이 포함되어 있습니다. 감정 분석은 기쁨, 슬픔, 분노, 두려움, 사랑, 놀라움 등 6가지 감정을 태그합니다.
직접 사용:https://go.hyper.ai/wFNO6
4. Eurus-2-RL-Data 수학 프로그래밍 문제 학습 데이터 세트
이 데이터 세트는 강화 학습 훈련에 특별히 사용되는 고품질 데이터 세트입니다. 주로 수학 및 프로그래밍 문제를 해결하는 데 사용되며, 약 455,000개의 수학 문제와 27,000개의 프로그래밍 문제가 포함되어 있습니다.
직접 사용:https://go.hyper.ai/Wdo1k
5. 의료 o1 추론 SFT 의료 추론 데이터 세트
이 데이터 세트는 복잡한 의학적 추론 작업에서 성능을 개선하기 위해 HuatuoGPT-o1 대규모 의학 언어 모델을 미세 조정하도록 설계되었습니다. 데이터 세트의 구성은 GPT-4o에 의존하는데, 이는 검증 가능한 의학적 질문을 검색하고 의학적 검증 도구를 사용하여 답변을 검증함으로써 데이터의 정확성과 신뢰성을 보장합니다.
직접 사용:https://go.hyper.ai/XMtXp
6. MCTS 중국어 간체 텍스트 데이터 세트
이 데이터 세트는 Penn Chinese Treebank(CTB) 표준에 따라 뉴스 코퍼스에서 선택한 723개의 복잡한 구조의 문장을 포함하고 있으며, 각 문장에는 여러 개의 수동 단순화된 버전이 적용되어 있어 중국어 텍스트 단순화 작업을 위한 가장 크고 가장 많이 참조되는 평가 데이터 세트가 되었습니다.
직접 사용:https://go.hyper.ai/UR3CN
7. educhat-sft-002-data-osm 교육 대화 데이터 세트
이 데이터 세트에는 400만 개의 데이터 포인트가 포함되어 있으며, 개방형 질의응답, 에세이 채점, 휴리스틱 교육, 정서적 지원, 과정 튜터링 등 다양한 교육 분야를 포괄합니다.
직접 사용:https://go.hyper.ai/nQw0K
8. GOAT 산술 작업 미세 조정 데이터 세트
이 데이터 세트에는 dataset.json과 dataset.ipynb라는 두 개의 파일이 있습니다. dataset.json 파일에는 dataset.ipynb에서 생성된 산술 작업을 위한 약 170만 개의 합성 데이터가 포함되어 있습니다.
직접 사용:https://go.hyper.ai/8ZAvG
9. NaturalProofs 수학적 추론 데이터 세트
이 데이터 세트는 자연어로 된 수학적 추론을 연구하기 위한 다중 도메인 코퍼스입니다. 이 책에는 약 3만 개의 정리 진술과 증명, 1만 5천 개의 정의, 2천 개의 추가 페이지(예: 공리, 추론)가 포함되어 있으며, 모두 자연스러운 수학 언어로 작성되었습니다.
직접 사용:https://go.hyper.ai/Bk4WE
10. TransGPT-pt&sft 트래픽 대화 사전 학습 데이터 세트
이 데이터 세트는 중국 최초의 종합 교통 모델인 TransGPT의 일부입니다. 여기에는 교통 분야의 텍스트 데이터 약 346,000개가 포함되어 있으며, 이는 교통 분야의 사전 학습에 사용되고, 교통 분야의 대화 데이터 약 58,000개가 포함되어 있으며, 이는 미세 조정에 사용됩니다.
직접 사용:https://go.hyper.ai/vuDHa
선택된 공개 튜토리얼
1. Hunyuan3D: 단 10초 만에 3D 자산 생성
Hunyuan3D는 경량 버전과 표준 버전을 포함하는 3D 생성 확산 모델로, 두 버전 모두 텍스트와 이미지 입력에서 고품질 3D 자산을 생성하는 것을 지원합니다. 정성적, 정량적 다차원 평가 후, Hunyuan3D-1.0은 기하학적 세부 사항, 질감 세부 사항, 질감-기하학적 일관성, 3차원 합리성 및 지시 준수 측면에서 매우 좋은 성과를 보였습니다.
이 튜토리얼은 Hunyuan3D의 가벼운 버전입니다. 아래 링크를 클릭하고 튜토리얼의 지침에 따라 3D 모델 생성을 경험해보세요.
온라인으로 실행:https://go.hyper.ai/Rsrno

2. TRELLIS: Microsoft의 오픈 소스 3D 자산 생성 모델 데모
TRELLIS는 Microsoft 팀이 2024년에 개발한 그래프 신경망 기반 해석 프레임워크입니다. 그래프 구조화된 데이터의 특성을 학습하여 효율적인 모델 해석 가능성을 제공하는 것을 목표로 합니다.
모델과 환경이 배포되었습니다. 튜토리얼의 설명에 따라 큰 모델을 사용하여 이미지를 3D 이미지로 변환할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/JE5s5

3.ChatGLM2-6b-32k의 빠른 배포
ChatGLM-6B는 중국어와 영어를 모두 지원하는 오픈 소스 대화형 언어 모델입니다. 이는 일반 언어 모델(GLM) 아키텍처를 기반으로 하며 62억 개의 매개변수를 가지고 있습니다. 모델 양자화 기술과 결합하여 사용자는 최소 6GB의 비디오 메모리를 갖춘 소비자 등급 그래픽 카드에서 로컬(INT4 양자화) 수준을 수행할 수 있습니다.
튜토리얼 단계를 따르고 생성된 API 주소를 직접 복사하여 ChatGLM-6B를 사용하세요.
온라인으로 실행:https://go.hyper.ai/B0b7V

4. NLTK를 활용한 자연어 처리
NLTK는 자연어 데이터를 사용하여 Python 프로그램을 만드는 데 가장 인기 있는 플랫폼 중 하나입니다. 분류, 토큰화, 어간 추출, 태그 지정, 구문 분석 및 의미 추론을 위한 텍스트 처리 라이브러리 외에도 50개 이상의 대규모 구조화된 텍스트 데이터 세트(코퍼스) 및 어휘 리소스에 대한 간단한 인터페이스를 제공합니다.
이 튜토리얼에서는 NLTK를 사용하여 텍스트 처리 단계에서 다양한 NLP 작업을 수행하는 방법과 NLTK 도구의 도움을 받아 감성 분석 텍스트 분류를 위한 Keras 모델을 만드는 방법을 보여줍니다.
온라인으로 실행:https://go.hyper.ai/BFZ10

5. 오디오 LDM 오디오 편집 튜토리얼
AudioLDM은 어떠한 텍스트 입력이라도 주어지면 사실적인 오디오 샘플을 생성할 수 있는 잠재적 텍스트-오디오 확산 모델입니다. AudioLDM은 텍스트 프롬프트를 입력으로 받아 해당 오디오를 예측합니다. 텍스트에 맞춰 사운드 효과, 사람의 말, 음악을 생성할 수 있습니다.
이 프로젝트는 Gradio 인터페이스를 통해 프런트엔드 대화형 인터페이스를 생성할 수 있습니다. 관련 모델과 종속성이 배포되었습니다. 아래 링크를 클릭하여 오디오를 편집하세요.
온라인으로 실행:https://go.hyper.ai/BCOWL
6. ShowUI: GUI 자동화에 초점을 맞춘 비전-언어-액션 모델
ShowUI 모델은 화면 인터페이스의 내용을 이해하고 클릭, 입력, 스크롤과 같은 대화형 작업을 수행하여 웹 및 모바일 애플리케이션 시나리오를 지원합니다. 복잡한 사용자 인터페이스 작업을 자동으로 완료할 수 있습니다. ShowUI는 스크린샷과 사용자 명령을 구문 분석하여 인터페이스에서 대화형 동작을 예측할 수 있습니다.
이 튜토리얼은 모델을 한 번의 클릭으로 배포하는 데모입니다. 컨테이너를 복제하고 시작하고, 생성된 API 주소를 직접 복사하여 모델을 경험하기만 하면 됩니다.
온라인으로 실행:https://go.hyper.ai/reHs7

💡또한, 안정적 확산 튜토리얼 교환 그룹도 만들었습니다. 친구들을 환영합니다. QR 코드를 스캔하고 [SD 튜토리얼]에 댓글을 남겨 그룹에 가입하여 다양한 기술 문제를 논의하고 신청 결과를 공유하세요~

커뮤니티 기사
1. 10가지 훌륭한 크리스마스 데이터 세트: 인기곡/선물 위시리스트/레시피/10년간의 크리스마스 트위터 카피라이터…
크리스마스 시즌을 맞아 HyperAI에서는 온라인 사용과 빠른 다운로드를 지원하는 크리스마스 관련 데이터 세트 10개를 준비했습니다. 와서 경험해 보세요.
데이터세트 요약 보기:https://go.hyper.ai/if7Lc
2. 비용이 100배나 절감되었습니다! 비영리 단체인 E11 Bio는 뇌의 수백만 개 세포 간 연결을 매핑하는 새로운 방법을 개발했습니다.
생명공학 회사 E11 Bio는 매우 저렴한 비용으로 뇌 전체의 수백만 개 세포 간 연결을 매핑할 수 있는 PRISM 기술을 출시했습니다. 이러한 일련의 혁신을 통해 전체 뇌 연결체학의 전체 비용이 최소 100배나 줄어들 것으로 예상되며, 이를 통해 앞으로 인간 뇌에 대한 탐구의 가능성이 제공될 것입니다. 이 기사는 회사에 대한 자세한 보고서입니다. 클릭해서 빠르게 읽어보세요.
전체 보고서 보기:https://go.hyper.ai/ISc4j
3. 다국적 정책/과학적 혁신/선구자/기업 레이아웃...2024년 AI4S 산업의 모든 주요 이벤트를 한 기사에 담았습니다.
HyperAI는 2024년 과학 분야 AI에서 큰 영향을 미칠 사건을 정리하고 검토했습니다. 자세한 보고서를 보려면 여기를 클릭하세요.
전체 보고서 보기:https://go.hyper.ai/d2Dlv
4. 지구 온난화는 역전시키기 어렵다. 스탠포드 연구팀은 AI를 활용해 역대 최고 기온 변화 예측, 확률 90% 기록
지속적인 지구 온난화로 인해 드물게 발생하는 극한 기후 현상이 빈번하게 발생하기 시작했습니다. 스탠포드 대학, 콜로라도 주립 대학, 취리히 연방 공과대학의 연구팀은 인공지능 합성 신경망 시스템을 사용하여 지구 온난화를 예측한 결과, 배출량을 빠르게 줄일 수 있다 하더라도 지구 온도가 계속 상승할 확률이 90%나 된다는 것을 발견했습니다. 본 논문은 논문에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/vDt3e
5. 퍼듀 대학교 팀은 인간의 반응적 파악을 시뮬레이션하여 로봇 학습을 위한 데이터 효율적인 촉각 표현을 달성했습니다.
퍼듀 대학교 박사과정 3학년인 쉬 정통은 로봇의 통합 촉각 표현을 위한 반응형 그래핑 컨트롤러 LeTac-MPC와 UniT에 대한 두 가지 주요 과학 연구 결과를 "로봇 학습을 위한 데이터 효율적인 촉각 표현"이라는 주제로 공유했습니다. 이 기사는 공유된 콘텐츠를 모아서 만든 것입니다. 클릭해서 빠르게 읽어보세요.
전체 보고서 보기:https://go.hyper.ai/IPIjj
6. 단백질 구조 예측의 벤치마크인 CASP를 위한 5가지 전투, 난카이 대학의 정웨이: 경쟁력과 난이도 증가, 실용적인 생물학 문제에 집중
CASP는 오랫동안 업계에서 단백질 구조 예측의 척도로 여겨져 왔습니다. 이러한 맥락에서 HyperAI는 정웨이 교수와 심층 인터뷰를 가질 수 있는 영광을 얻었습니다. 그는 업계의 벤치마크 역할을 하는 국제 대회인 CASP를 통해 단백질 구조 예측 분야의 현재 개발 동향을 분석해 주었습니다. 유용한 정보가 가득합니다. 클릭해서 빠르게 읽어보세요.
전체 보고서 보기:https://go.hyper.ai/Y83iz
7. MIT는 30년간의 끈기 끝에 차세대 리튬 배터리를 목표로 하고 있으며 생성적 AI를 사용하여 고체 전해질 분야에서 획기적인 발전을 이루었습니다.
최근 연구에서 MIT와 도요타 연구소의 연구팀은 폴리머 생성에서 다양한 고급 생성 모델의 복잡성을 심층적으로 조사하고, 새로운 GPT 및 확산 기반 폴리머 전해질을 지속적으로 생성하고 평가할 수 있는 새로운 설계 방법을 제안하여 실험 테스트를 위한 새로운 후보를 제공했습니다. 본 논문은 논문에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/PDc8J
8. 단지! 세계에서 가장 빠른 GPU RTX 5090의 공식 가격은 14,000위안이 넘고, 거세된 5090 D의 중국 버전은 16,000위안이 넘습니다.
CES 2025 컨퍼런스에서 Nvidia RTX 5090이 공식 발표되었습니다. 이는 지금까지 가장 빠른 GeForce RTX GPU입니다. 출시 가격은 14,000위안이고, 5090D의 국내 버전은 16,000위안입니다. RTX 5090은 FP4 지원 기능을 추가하여 이전 세대보다 메모리 사용량을 줄이고 생성 AI 모델을 최대 2배 더 빠르게 실행할 수 있습니다. 이 기사는 제품에 대한 자세한 소개입니다. 클릭해서 빠르게 읽어보세요.
전체 보고서 보기:https://go.hyper.ai/dyyZS
인기 백과사전 기사
1. 핵 규범
2. 대응 t-검정
3. 대규모 멀티태스크 언어 이해(MMLU)
4. 시그모이드 함수
5. 최소제곱법
다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.
최고 컨퍼런스 1월 마감일

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event
위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!
다음주에 뵙겠습니다!
HyperAI 소개
HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.
* 1700개 이상의 공개 데이터 세트에 대한 국내 가속 다운로드 노드 제공
* 500개 이상의 고전적이고 인기 있는 온라인 튜토리얼 포함
* 200개 이상의 AI4Science 논문 사례 해석
* 600개 이상의 관련 용어 검색 지원
* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅
학습 여정을 시작하려면 공식 웹사이트를 방문하세요.
마지막으로 "크리에이터 인센티브 프로그램"을 추천드립니다. 관심 있는 친구들은 QR 코드를 스캔하여 참여할 수 있습니다!
