Llama 3.3의 유일한 오픈소스 70B 모델을 온라인에서 실행하면 405B와 비슷한 성능을 얻을 수 있습니다! LaTeX OCR 데이터 세트를 사용하여 수학 공식 인식을 도울 수 있습니다.

이번 달에 Meta는 Llama 3.3의 유일한 오픈 소스 모델인 Llama-3.3-70B-Instruct를 출시했습니다. 매개변수 크기는 70B에 불과하지만 성능은 405B 모델과 비슷합니다. 이 모델은 라마 3 시리즈의 마지막 모델입니다. 주커버그는 "라마 4에게 작별인사를 할 거야!"라고 말했습니다.
hyper.ai 공식 웹사이트의 튜토리얼 섹션에서 "Llama-3.3-70B-Instruct의 원클릭 배포" 기능이 출시되었습니다. 라마3의 완성작을 함께 경험해보세요~
온라인 사용:https://go.hyper.ai/TthEw
12월 23일부터 12월 29일까지 hyper.ai 공식 웹사이트가 업데이트되었습니다.
* 고품질 공개 데이터 세트: 10
* 고품질 튜토리얼 선택: 3개
* 커뮤니티 기사 선정: 6개 기사
* 인기 백과사전 항목: 5개
* 1월에 마감일이 있는 주요 컨퍼런스: 9개
공식 웹사이트를 방문하세요:하이퍼.AI
선택된 공개 데이터 세트
데이터 세트에는 560개의 이미지가 포함되어 있으며, 각 이미지는 세부적으로 의미적으로 분할되어 있으며 객체, 속성, 관계로 주석이 달려 있어 완전한 지향형 장면 그래프 구조를 형성합니다.
직접 사용:https://go.hyper.ai/icfaH

2. HelmetViolations 헬멧 인식 데이터 세트
이 데이터 세트에는 YOLOv9 형식으로 주석이 달린 총 1,004개의 이미지가 포함되어 있으며, 번호판(Plate), 헬멧 착용(WithHelmet), 헬멧 미착용(WithoutHelmet)의 3가지 카테고리가 있습니다. 훈련 세트에는 363개의 이미지(원본 + 증강)가 있습니다. 검증 세트에는 53개의 이미지가 있습니다. 모델 평가를 위한 내보내기에 테스트 세트가 포함됩니다.
직접 사용:https://go.hyper.ai/N0Yyg

3. SynCamVideo-Dataset 다중 카메라 동기식 비디오 데이터 세트
이 데이터 세트에는 36개의 카메라로 촬영한 1,000개의 서로 다른 장면이 포함되어 있으며, 총 36,000개의 비디오가 생성되었습니다. 여기서 50종의 서로 다른 동물이 "주요 피사체"로 사용되었고, Poly Haven의 20개 서로 다른 위치가 배경으로 사용되었습니다.
직접 사용:https://go.hyper.ai/oIJns

4. 항공기 이미지 분류 항공기 이미지 분류 데이터 세트
이 데이터 세트는 3,371개의 항공기 이미지를 담고 있는 데이터 세트로, 10개의 카테고리 폴더로 나뉘며, 각 카테고리는 특정 항공기 모델(A10, A400M, AG600, AH64, AV8B, An124, An22, An225, An72, B1 등)에 해당합니다.
직접 사용:https://go.hyper.ai/IL3uP

MangaZero 데이터 세트는 만화 생성 작업을 위해 특별히 설계된 대규모, 다중 캐릭터, 다중 상태 만화 이미지 데이터 세트입니다. 이 책에는 43,264페이지의 만화와 427,147개의 주석이 달린 패널이 들어 있습니다. 연속된 프레임에서 다양한 캐릭터의 상호작용과 동작을 시각화하는 기능을 지원하며, 다중 캐릭터, 다중 상태의 만화 생성 작업에 적합합니다.
직접 사용:https://go.hyper.ai/IpkjL
LaTeX OCR 데이터 세트는 광학 문자 인식(OCR) 분야의 복잡한 수학 공식 인식 문제에 초점을 맞춘 데이터 세트입니다. LaTeX OCR 데이터 세트에는 여러 가지 구성이 포함되어 있으며, 각 구성에는 서로 다른 기능과 데이터 분할이 있습니다.
직접 사용:https://go.hyper.ai/lyK1J
이 데이터 세트에는 200개 이상의 국가와 지역을 포괄하는 1억 개 이상의 글로벌 관심 지점(POI)이 포함되어 있어 연구자, 개발자, 기업이 풍부한 지리공간 데이터에 접근할 수 있습니다. 지명, 주소, 경도, 위도 등의 주요 정보를 포함한 22개의 핵심 속성을 제공하며, 이를 통해 공간 분석 및 위치 서비스 등 다양한 애플리케이션을 지원합니다.
직접 사용:https://go.hyper.ai/7oN5M
8. ProcessBench 수학적 추론 벤치마크 데이터 세트
이 데이터 세트에는 경쟁적인 수학 문제와 올림피아드 난이도에 초점을 맞춘 3.4k개의 테스트 예제가 포함되어 있습니다. 각 예제에는 도메인 전문가가 단계별 솔루션을 제시하고 정확한 오류 표시를 제공합니다.
직접 사용:https://go.hyper.ai/fk3hq
이 중국 의학 데이터 세트는 의학 분야에서 전문적인 대화와 권장 사항을 제공할 수 있는 언어 모델을 개발하고 훈련하기 위한 포괄적인 리소스입니다. 백과사전 지식, 교과서 텍스트, 실제 의사-환자 대화, 평가 데이터 등 다양한 유형의 데이터를 결합하여 모델의 정확성과 실용성을 향상시킵니다.
직접 사용:https://go.hyper.ai/wkAXX
10. splsoNet 이방성 보정 및 정렬 불량 보정 튜토리얼 데이터 세트
spIsoNet은 선호 방향 문제로 인해 발생하는 맵 이방성 및 입자 정렬 오류를 해결하기 위한 종단 간 자체 감독 딥 러닝 소프트웨어입니다. 이 데이터 세트는 연구에 사용되었으며, 관련 결과는 국제 학술지인 Nature Methods에 게재되었습니다.
직접 사용:https://go.hyper.ai/tFOqJ
선택된 공개 튜토리얼
1. Llama-3.3-70B-Instruct의 원클릭 배포
Llama-3.3-70B-Instruct는 Meta가 2024년에 출시한 대규모 언어 모델입니다. Llama 3.3 시리즈에서 유일한 오픈 소스 모델이며, 특별히 최적화된 명령어 미세 조정 버전을 갖추고 있습니다.
모델은 환경과 종속성을 구성했습니다. API 주소를 입력하여 모델과 대화를 시작할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/TthEw

2. HunyuanVideo Tencent Hunyuan Wensheng 비디오 데모
HunyuanVideo는 인공지능 기술을 통해 사용자가 고품질의 비디오 콘텐츠를 제작할 수 있도록 돕는 것을 목표로 합니다. HunyuanVideo는 현재 오픈소스 모델 중에서 매개변수 수가 가장 많은 Wensheng 비디오 모델로, 매개변수는 130억 개입니다. 높은 물리적 정확도와 장면 일관성을 갖춘 비디오 콘텐츠를 생성하고, 사용자에게 매우 사실적인 시각적 경험을 제공하며, 실제와 가상 스타일을 자유롭게 전환할 수 있습니다.
이 프로젝트는 편리한 웹 인터페이스를 제공하며, 사용자는 간단한 텍스트 설명을 제공하거나 조건을 지정하여 다양한 스타일의 비디오를 생성할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/hEkOw

이 튜토리얼에서는 cuBLAS나 rocBLAS와 비슷한 성능을 보이는 매우 짧고 고성능의 FP16 행렬 곱셈 커널을 작성해 보겠습니다. 구체적으로 다음에 대해 배우게 됩니다: 다단계 행렬 곱셈; 다차원 포인터 산술 L2 캐시 적중률을 개선하기 위한 프로그램 재정렬 자동 성능 튜닝.
온라인으로 실행:https://go.hyper.ai/riM7b

커뮤니티 기사
1. AI, 재료화학을 파괴하다, 2024년 가장 주목할 만한 과학 연구 결과 요약
HyperAI는 2023~2024년 동안 해석된 최첨단 논문 26편을 선정하여 분류했습니다. 본 논문은 재료화학 분야에서의 AI 연구에 초점을 맞추고 있습니다. 포괄적인 리뷰이므로, 클릭하여 빠르게 읽어보세요.
전체 보고서 보기:https://go.hyper.ai/XnzcN
2. 화학에서 튜링 머신을 만드는 것을 목표로 하세요! AI 제약회사 케미파이, 세계 최초 화학컴파일러 개발해 미국 시장 진출
영국의 첨단 화학 회사인 케미파이(Chemify)는 세계 최초의 "화학적 튜링 머신"과 세계 최초의 화학 컴파일러를 개발했습니다. 화학 컴퓨팅, 인공지능, 로봇공학, 자동화 등을 약물 연구 및 개발에 통합하여 화학의 디지털 개발을 촉진하는 데 전념하고 있습니다. 이 기사는 회사에 대한 자세한 보고서입니다. 클릭해서 빠르게 읽어보세요.
전체 보고서 보기:https://go.hyper.ai/V5VWB
3. 초대규모 병리학적 이미지 분석을 목표로 합니다! 화중과학기술대학교, 쇼그렌증후군 진단 정확도 향상 위한 의료영상 분할 모델 제안
화중과학기술대학의 투웨이 교수, 루펑 교수 등은 쇼그렌 증후군 환자의 병리학적 이미지에서 림프구 응집 초점을 정확하게 식별할 수 있는 의료 영상 분할 모델을 제안하여 의사들이 더 빠르고 정확한 진단을 내리는 데 도움을 주었습니다. 본 논문은 논문에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/EetpB
4. 미래의 구체화된 지능의 촉각 혁명! TactEdge 센서는 로봇에게 정밀한 촉각 인식 기능을 제공하여 원단 결함 감지 및 정교한 작업 제어를 가능하게 합니다.
중국 지질대학(베이징)의 장스신 연구팀은 2014년부터 시각-촉각 센서에 대한 연구를 진행해 왔습니다. 그들은 여러 세대의 센서 기술을 탐구하고 개발했으며 이를 최첨단 촉각 기술인 TactEdge라고 명명했습니다. 본 기사는 관련 연구 결과에 대한 자세한 소개입니다. 빠르게 읽으려면 클릭하세요.
전체 보고서 보기:https://go.hyper.ai/nOE2a
5. 2024년 의료 AI 혁신 사례 검토, 놓칠 수 없는 최첨단 논문 35편
이 글은 의료 분야에서의 AI 연구에 초점을 맞추고 있습니다. 우리는 2023-2024년 동안 해석된 최첨단 논문 35편을 선정하여 여러분과 공유하고자 합니다. 빠르게 읽으려면 클릭하세요.
전체 보고서 보기:https://go.hyper.ai/CZdYT
6. LeCun이 전달함, UC Berkeley et al. 단백질 서열과 전체 원자 구조를 동시에 생성하는 다중 모드 단백질 생성 방법 PLAID를 제안했습니다.
캘리포니아 대학교 버클리 캠퍼스, 마이크로소프트 연구소 및 기타 연구진은 풍부한 데이터 모달리티에서 부족한 모달리티를 생성하여 다중 모달 생성을 달성할 수 있는 다중 모달 단백질 생성 방법인 PLAID를 제안했습니다. 본 논문은 논문에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/nwnDy
인기 백과사전 기사
1. 시그모이드 함수
2. 상호 정렬 융합 RRF
3. 핵 규범
4. 대규모 언어 모델
5. 장기 단기 기억
다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event
위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!
다음주에 뵙겠습니다!