GPT-4o를 넘어! HTML에서 Markdown까지, 복잡한 웹 페이지를 한 번의 클릭으로 구성하세요. AI 대화는 더 이상 차갑지 않으며 대규모 모델 대화는 응답을 더욱 원활하게 하기 위해 데이터 세트를 미세 조정합니다.

중복된 정보가 담긴 웹 페이지 콘텐츠에서 포괄적인 핵심 정보를 빠르게 추출하려면 어떻게 해야 할까요? Reader-LM 모델은 전문적인 솔루션을 제공합니다. Reader-LM은 최대 256K 바이트의 매우 긴 콘텐츠를 효율적으로 처리하고 HTML을 명확한 마크다운 형식으로 정확하게 변환할 수 있습니다. 그 성능은 GPT-4o와 같은 대규모 언어 모델보다 훨씬 뛰어나며, 가벼운 디자인 덕분에 리소스가 제한된 시나리오에 더욱 적합합니다.
현재,Reader-LM 모델은 이제 hyper.ai 웹사이트에서 사용할 수 있습니다. 한 번의 클릭으로 효율적인 변환을 경험할 수 있습니다. 더 이상 웹 정보를 구성하는 것에 대해 걱정할 필요가 없습니다.
1월 13일부터 1월 17일까지 hyper.ai 공식 홈페이지가 빠르게 업데이트되었습니다.
* 고품질 공개 데이터 세트: 10
* 고품질 튜토리얼: 9개
* 커뮤니티 게시물 선정: 5개 게시물
* 인기 백과사전 항목: 5개
* 1월 마감일이 있는 상위 컨퍼런스: 5개
공식 웹사이트를 방문하세요: hyper.ai
선택된 공개 데이터 세트
1. 인간과 유사한 DPO 데이터 세트 대규모 모델 대화 미세 조정 데이터 세트
이 데이터 세트는 대규모 언어 모델 대화의 유창성과 참여도를 개선하도록 특별히 설계되었으며, 모델이 더욱 인간적인 응답을 생성하도록 안내하는 것을 목표로 합니다. 이 데이터 세트는 256개 주제를 다루며 기술, 일상생활, 과학, 역사, 예술 등 다양한 분야에서 10,884개의 샘플을 포함하고 있습니다.
직접 사용:https://go.hyper.ai/zDsGL

2. MedQA 의료 텍스트 질의응답 데이터세트
MedQA 데이터 세트는 미국 의사면허시험(USMLE)의 스타일을 시뮬레이션하고 모델의 의학 지식에 대한 이해도와 적용 능력을 평가하도록 설계되었습니다. 이 데이터 세트는 전문적인 의료 검진에서 수집되었으며 영어, 간체 중국어, 번체 중국어를 포함하고 있으며 각각 12,723개, 34,251개, 14,123개의 질문이 포함되어 있습니다.
직접 사용:https://go.hyper.ai/cV2ei

3. 야채 식별 야채 이미지 인식 데이터 세트
이 데이터 세트에는 가지, 콩, 오크라, 호박, 감자, 양파 등 6가지 종류의 야채 이미지가 포함되어 있으며, 각 종류별로 800장씩, 총 4,800장의 이미지가 있습니다. 이 연구의 목표는 야채 감지, 분류 및 인식 분야에서 머신 러닝과 컴퓨터 비전의 역량을 강화하는 것입니다.
직접 사용:https://go.hyper.ai/mCZr4

4. 중국 거리 뷰 교통 표지판 데이터 세트
이 데이터 세트는 9,898개의 거리 풍경 이미지로 구성되어 있습니다. 각 사진에는 적어도 하나 이상의 교통 표지판이 포함되어 있으며, 교통 표지판의 좌표와 범주가 표시되어 있습니다. 이 데이터는 중국 교통 표지판 감지 데이터베이스에서 나왔습니다.
직접 사용:https://go.hyper.ai/9wb5f

5. 사전 처리된 뱀 이미지
이 데이터 세트에는 북부물뱀, 일반 양말뱀, 데커스갈색뱀, 검은쥐뱀, 서부방울뱀 등 5종의 뱀이 포함되어 있습니다. 데이터세트는 밝기와 대비를 높이고, 이미지를 수동으로 제거하고 잘라내어 이미지를 더 깔끔하고 균일하며 사용하기 편리하게 만들기 위해 사전 처리되었습니다.
직접 사용:https://go.hyper.ai/YAgyI

6. 중국 교통 표지판 중국 교통 표지판 이미지 데이터
이 데이터 세트에는 58개 카테고리의 5,998개 교통 표지판 이미지가 포함되어 있습니다. 각 이미지는 단일 교통 표지판을 확대해서 본 것입니다. 주석은 이미지 속성(파일 이름, 너비, 높이)은 물론 이미지 내의 교통 표지판 좌표와 카테고리(예: 속도 제한 5km/h)를 제공합니다.
직접 사용:https://go.hyper.ai/Tvvh8

7. 인간 스타일 선호도 이미지 이미지 생성 선호도 데이터 세트
이 데이터 세트는 텍스트-이미지 생성 모델을 평가하기 위해 사람이 주석을 단 데이터 세트입니다. 이 방법은 두 장의 이미지를 보여주고 참가자에게 어느 이미지가 덜 이상하거나 부자연스러워 보이는지 묻는 방식으로 이미지 생성 모델에 대한 인간의 합의 평가를 수집하며, 여기에는 120만 개 이상의 인간의 합의 투표가 포함됩니다.
직접 사용:https://go.hyper.ai/dErEz
8. M²E: 다중 라인 수학 공식 데이터 세트
이 데이터 세트에는 99,956개의 다중선 수학적 표현 이미지와 주석이 포함되어 있습니다. 모든 이미지는 실제 풍경을 휴대전화로 촬영한 것이며, 수학 공식 인식 과제를 위해 수학 시험지와 연습장에서 여러 줄의 수학 공식을 캡처했습니다.
직접 사용:https://go.hyper.ai/5BMnN
9. 중국어 쌍시 데이터 세트
이 데이터 세트에는 약 74만 개의 연이 포함되어 있습니다. fixed_couplets_in.txt는 위의 커플릿이고 fixed_couplets_out.txt는 아래의 커플릿입니다.
직접 사용:https://go.hyper.ai/oPxHl
10. 오디오 노이즈 데이터 세트
이 데이터 세트에는 10가지의 서로 다른 노이즈 카테고리가 포함되어 있으며, 오디오 분류, 오디오 인식, 오디오 생성 및 오디오 관련 머신 러닝에서 노이즈 필터링, 노이즈 생성 및 노이즈 인식에 사용할 수 있습니다.
직접 사용:https://go.hyper.ai/MXXZy
선택된 공개 튜토리얼
1. Reader-LM: HTML을 MarkDown으로 빠르고 효율적으로 변환
Reader-LM은 웹의 원시 HTML 콘텐츠를 명확하고 깔끔한 Markdown 형식으로 변환하도록 특별히 설계된 모델입니다. 최대 256K 바이트의 컨텍스트 길이를 지원하여 긴 텍스트와 다국어 콘텐츠를 처리하는 데 탁월합니다. 이 연구의 목적은 노이즈가 많은 웹 콘텐츠에서 효율적이고 경제적으로 데이터를 추출해야 할 필요성을 해결하는 것입니다.
이 튜토리얼에서는 reader-lm-1.5b 또는 reader-lm-0.5b를 사용하여 HTML을 마크다운으로 변환하는 방법을 보여줍니다. 아래 링크를 클릭하고 튜토리얼을 따라 체험해 보세요.
온라인으로 실행:https://go.hyper.ai/S15IL

2. DeepSeek-V2-Lite-Chat의 원클릭 배포
DeepSeek-V2는 경제적으로 학습하고 효율적으로 추론할 수 있는 강력한 전문가 혼합(MoE) 언어 모델입니다. 총 236B개의 매개변수가 포함되어 있으며, 각 토큰은 21B개의 매개변수를 활성화합니다.
이 튜토리얼은 DeepSeek-V2-Lite-Chat의 원클릭 배포 데모입니다. 컨테이너를 복제하고 시작하고, 생성된 API 주소를 직접 복사하기만 하면 모델의 추론을 경험할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/AD6XU

3.ChemVLM-26B의 원클릭 배포
ChemVLM은 화학을 위한 오픈 소스 멀티모달 대규모 언어 모델입니다. 이 모델은 화학적 이미지 이해와 텍스트 분석 사이의 비호환성을 해결하는 것을 목표로 합니다. Visual Transformer(ViT), Multi-layer Perceptron(MLP), Large Language Model(LLM)의 장점을 결합하여 화학 이미지와 텍스트에 대한 포괄적인 추론을 실현합니다.
튜토리얼 단계를 따르고 생성된 API 주소를 직접 복사하여 ChatVLM-26B를 사용하세요.
온라인으로 실행:https://go.hyper.ai/NRBXG

4. Parler-TTS의 원클릭 배포
Parler-TTS는 주어진 화자의 스타일로 고품질의 자연스러운 음성을 생성할 수 있는 가벼운 텍스트-음성(TTS) 모델입니다. 높은 수준의 자유도와 혁신성을 갖추고 있으며, 프롬프트를 통해 화자의 성별, 음색, 음조, 장면(실내, 실외, 도로, 콘서트 홀 등)을 제어할 수 있습니다.
이 프로젝트는 Gradio 인터페이스를 통해 프런트엔드 대화형 인터페이스를 생성할 수 있습니다. 관련 모델과 종속성이 배포되었으며, 한 번의 클릭으로 물 소리 파일을 생성할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/pk6lF

5. MegActor 인물 애니메이션 생성기 데모
MegActor는 원시 비디오를 드라이버로 사용하여 사실적이고 생동감 넘치는 대화 영상을 제작하는 인물 애니메이터입니다.
튜토리얼 단계를 따르고 런처를 복제한 다음 API 주소를 열면 원본 비디오 콘텐츠를 기반으로 생생한 합성 비디오가 생성됩니다.
온라인으로 실행:https://go.hyper.ai/wkCPo

6. Flash-VStream 비디오 이해 데모
Flash-VStream은 인간의 기억 메커니즘을 시뮬레이션하는 비디오 언어 모델입니다. 매우 긴 비디오 스트림을 실시간으로 처리하고 사용자 질의에 동시에 응답할 수 있습니다.
이 튜토리얼은 Flash-VStream을 한 번의 클릭으로 실행하는 데모입니다. 관련 환경과 종속성이 설치되었습니다. 한 번의 클릭으로 복제하고 시작하여 체험해 볼 수 있습니다.
온라인으로 실행:https://go.hyper.ai/M3pBO

7. PhotoMaker V2는 몇 초 만에 개인화된 인물 사진을 생성합니다. 데모
PhotoMaker는 Tencent 팀이 2024년에 오픈 소스로 공개한 효율적인 인물 사진 맞춤형 그래픽 모델입니다. 인물 사진을 기반으로 맞춤형 예술적 스타일의 사진을 빠르게 생성할 수 있습니다. 사람들의 개인화된 사진을 생성하는 것 외에도, 사람들의 나이와 성별을 변경하고, 다양한 사람들의 특성을 통합하여 새로운 개인 정보를 생성할 수도 있습니다.
이 튜토리얼은 PhotoMaker 2.0 버전으로, V1에 비해 캐릭터의 일관성과 제어성이 크게 향상되었습니다.
온라인으로 실행:https://go.hyper.ai/VcewN

8. StoryDiffusion 만화 영상 생성기 데모
StoryDiffusion은 장거리 이미지 및 비디오 생성에 중점을 둔 AI 도구입니다. 이 기술은 일관된 셀프 어텐션 메커니즘을 사용하여 이미지와 비디오 콘텐츠의 연속성과 일관성을 보장하고, 만화나 만화 캐릭터를 만들거나 긴 비디오를 제작할 때 스타일의 일관성을 유지합니다.
이 튜토리얼은 StoryDiffusion 원클릭 실행 패키지의 최신 버전입니다. 한 번의 클릭으로 복제하여 StoryDiffusion을 경험할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/HPu2p

9. 사용하기 쉬운 분자 동역학 시뮬레이터 LAMMPS: FCC Cu의 녹는점을 추정하기 위한 npt 온도 제어
LAMMPS는 고체 물질(금속, 반도체), 생체 분자, 폴리머 등 다양한 물질을 모델링하는 데 사용할 수 있으며, 서로 다른 물질에 대한 다양한 입자 상호 작용 모델을 제공할 수 있습니다.
이 튜토리얼은 LAMMPS에 대한 소개 튜토리얼입니다: npt 온도 제어를 사용하여 FCC Cu의 녹는점을 추정합니다. LAMMPS의 CPU 버전을 사용하여 실행하면 분자 동역학 시뮬레이션을 경험할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/qQSqr
💡또한, 안정적 확산 튜토리얼 교환 그룹도 만들었습니다. 친구들을 환영합니다. QR 코드를 스캔하고 [SD 튜토리얼]에 댓글을 남겨 그룹에 가입하여 다양한 기술 문제를 논의하고 신청 결과를 공유하세요~

커뮤니티 기사
1. 이벤트 리뷰 | 컴퓨팅, 네트워크, 소프트웨어, 알고리즘, 생태학의 조화로운 발전, 2024 Meet AI Compiler가 성공적으로 마무리되었습니다!
AI 컴파일러를 만나보세요. 6번째 기술 살롱 리뷰가 나왔습니다. Horizon Robotics, Zhiyuan, ByteDance, Lingchuan Technology의 4명의 수석 컴파일러 전문가가 각 팀의 최신 연구 결과를 모두에게 보여주었습니다. 동시에, 그들은 풍부한 실제 적용 사례를 결합하여 이러한 결과가 실제 문제를 해결하는 데 미치는 영향과 적용 과정을 이해하기 쉬운 방식으로 설명했습니다.
이벤트 요약 보기:https://go.hyper.ai/KDzY3
2. 컴퓨터 비전에서 의료 AI까지, 상하이 교통대학교의 셰 웨이디와의 대화: 문제 정의가 해결보다 더 중요하다
HyperAI는 상하이 교통대학교의 종신 교수인 셰 웨이디 교수와 심층 인터뷰를 진행했습니다. 그는 자신의 개인적인 경험을 바탕으로 컴퓨터 비전에서 헬스케어용 AI로 전환하는 데 대한 경험을 우리와 공유했으며, 또한 업계의 미래 개발 추세에 대한 심층적인 분석도 했습니다. 이것은 인터뷰에 대한 자세한 보고서입니다.
전체 보고서 보기:https://go.hyper.ai/LqpqE
촉각 인식은 지능형 로봇과 인간-컴퓨터 상호작용의 중요한 역량 중 하나이지만, 고정밀과 빠른 반응의 촉각 감지를 달성하는 방법은 여전히 많은 과제에 직면해 있습니다. 프랑스 국립과학연구센터의 얀 유칸 박사는 유연한 자기 필름을 기반으로 한 촉각 센서의 설계와 응용에 대해 모든 사람과 공유했으며, 직교 자기화된 할바흐 배열을 사용하여 3차원 힘의 자체 분리를 달성하는 방법을 소개했습니다. 이 기사는 공유된 내용을 자세히 보고한 것입니다.
전체 보고서 보기:https://go.hyper.ai/Y5uA0
4. AAAI 2025에 선정되었습니다! 다중모달 의료영상의 정렬 및 융합을 실현할 수 있습니다. 국내 2대 대학, BSAFusion 공동 제안
다중 모드 의료 영상 융합을 통해 많은 귀중한 정보를 발견해 내고 의사가 더욱 전문적인 질병 진단을 내리는 데 도움이 되지만, 현재 직면한 주요 과제는 융합에 사용되는 기능과 정렬에 사용되는 기능이 호환되지 않는다는 것입니다. 쿤밍 과학기술대학과 중국해양대학은 공동으로 양방향 단계별 특징 정렬 방법인 BSAFusion을 제안했는데, 이를 통해 다중 모드 의료 이미지 정렬 및 융합을 실현할 수 있습니다. 본 논문은 논문에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/sTySj
의료 자원의 부족은 세계 의료 시스템을 괴롭히는 장기적인 문제입니다. 이를 위해 4개 주요 대학의 연구팀은 KG4Diagnosis를 제안했습니다. 이는 의료 지식 그래프의 구성, 진단, 치료 및 추론을 자동화하는 데 사용할 수 있는 새로운 계층적 다중 에이전트 프레임워크로, 비만과 같은 여러 의학 분야에서 흔히 발생하는 362가지 질병을 진단하는 데 도움이 됩니다. 본 논문은 논문에 대한 자세한 해석과 공유입니다.
전체 보고서 보기:https://go.hyper.ai/0CPhV
인기 백과사전 기사
1. 확산 손실
2. 인과적 주의
3. 콜모고로프-아놀드 표현 정리
4. 대규모 멀티태스크 언어 이해(MMLU)
5. 대조 학습
다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.
최고 컨퍼런스 1월 마감일

최고 AI 학술 컨퍼런스에 대한 원스톱 추적:https://go.hyper.ai/event
위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!
다음주에 뵙겠습니다!
HyperAI 소개
HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.
* 1700개 이상의 공개 데이터 세트에 대한 국내 가속 다운로드 노드 제공
* 500개 이상의 고전적이고 인기 있는 온라인 튜토리얼 포함
* 200개 이상의 AI4Science 논문 사례 해석
* 600개 이상의 관련 용어 검색 지원
* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅
학습 여정을 시작하려면 공식 웹사이트를 방문하세요.
마지막으로 "크리에이터 인센티브 프로그램"을 추천드립니다. 관심 있는 친구들은 QR 코드를 스캔하여 참여할 수 있습니다!
