Command Palette
Search for a command to run...
로컬에서 실행 가능한 개인정보 탐지 모델인 Privacy Filter는 저비용으로 고품질 개인정보 필터링을 구현합니다. 완전 오픈 소스 프로젝트이며, 8만 건 이상의 경기가 포함된 Transfermarkt 구조화된 축구 데이터셋을 지원합니다.

프라이버시 필터(Privacy Filter)는 OpenAI에서 개발한 오픈소스 양방향 레이블 분류 모델로, 대용량 데이터 정제에 사용됩니다. 텍스트에서 개인 식별 정보(PII)를 효율적으로 탐지하고 마스킹하는 데 활용됩니다. GPT-OSS와 유사한 소규모 사전 학습 아키텍처를 기반으로 하며, 기존의 단어 단위 생성 방식을 버리고 제약 조건이 있는 비터비 알고리즘과 결합된 단일 순방향 전파를 통해 입력 시퀀스의 일관성 있는 부분을 직접 디코딩합니다.
현재 HyperAI 웹사이트에서 [해당 섹션/기능]을 출시했습니다.개인 정보 필터 모델와서 한번 드셔보세요!
온라인 사용:https://go.hyper.ai/Py1l3
4월 25일부터 4월 30일까지 hyper.ai 공식 웹사이트의 주요 업데이트 사항을 간략하게 살펴보겠습니다.
* 고품질 공개 데이터 세트: 5
* 엄선된 고품질 튜토리얼: 5개
* 커뮤니티 게시글 분석: 게시글 1개
* 인기 백과사전 항목: 5개
공식 웹사이트를 방문하세요:하이퍼.AI
선택된 공개 데이터 세트
1. Transfermarkt 축구 데이터 세트
트랜스퍼마크 풋볼(Transfermarkt Football)은 스포츠 분석 및 데이터 모델링을 위해 트랜스퍼마크 웹사이트를 기반으로 구축된 구조화된 축구 이적 시장 데이터 세트입니다. 이 데이터 세트에는 8만 건 이상의 축구 경기, 400개 클럽, 3만 7천 명 이상의 선수 정보가 포함되어 있으며, 선수 시장 가치 변동, 출전 횟수, 이적 활동 등을 기록하고 있습니다.
온라인 사용:https://go.hyper.ai/lF661
2. 요가 훈련: 요가 자세 분류 및 훈련 데이터 세트
Yoga Training 데이터셋은 요가 자세 분류를 위한 데이터셋으로, 주로 이미지 분류, 자세 인식, 경량 딥러닝 학습 및 전이 학습 실험에 사용됩니다. 이 데이터셋은 다양한 난이도와 자세 범주를 아우르는 1,771개의 요가 자세 샘플 이미지를 포함하고 있습니다.
온라인 사용:https://go.hyper.ai/hVdM8
3. 옥수수 잎 질병 데이터 세트
옥수수 잎 질병 데이터셋은 정밀 농업 분야의 목표물 탐지 작업을 위해 특별히 설계된 옥수수 잎 이미지 모음입니다. 이 데이터셋은 건강한 옥수수 잎과 녹병, 회색반점병, 시들음병 등 세 가지 일반적인 질병에 걸린 옥수수 잎을 포함한 총 4,027개의 이미지로 구성되어 있습니다.
온라인 사용:https://go.hyper.ai/UbRRp
4. 사과 잎 질병 데이터 세트
사과잎 질병 데이터셋은 정밀 농업 분야의 목표물 탐지 작업을 위해 특별히 설계된 고품질 사과잎 이미지 데이터셋입니다. 이 데이터셋은 건강한 사과잎과 세 가지 일반적인 질병(흑부병, 삼나무녹병, 사과딱지병)에 걸린 사과잎을 포함하여 총 3,444개의 사과잎 이미지를 담고 있습니다.
온라인 사용:https://go.hyper.ai/LDafw
5. 약물 부작용 감지 데이터 세트
약물 부작용 감지 데이터셋은 환자에게 여러 약물이 처방되는 실제 상황을 시뮬레이션한 텍스트 데이터셋입니다. 이 데이터셋은 여러 약물의 병용 투여로 인한 약물 부작용 위험을 연구하는 것을 목표로 하며, 약물 부작용 감지, 의료 정보 추출, 임상 텍스트 분석, 의료 AI 모델 학습 등 다양한 분야에서 활용될 수 있습니다.
온라인 사용:https://go.hyper.ai/AlL32
선택된 공개 튜토리얼
1. 개인정보 필터 모델
OpenAI Privacy Filter는 OpenAI에서 2026년 4월에 공개한 양방향 토큰 분류 모델로, 텍스트에서 개인 식별 정보(PII)를 탐지하고 마스킹하는 데 사용됩니다. 이 모델은 gpt-oss와 유사한 아키텍처를 채택했지만 규모는 더 작습니다. 공식 모델 카드 설명에 따르면, 총 약 15억 개의 파라미터와 약 5천만 개의 활성 파라미터를 가지고 있으며, 최대 12만 8천 개의 토큰 컨텍스트를 지원하고, 33개의 BIOES 토큰 레벨 레이블을 통해 개인정보 보호 영역 경계를 출력합니다.
온라인으로 실행:https://go.hyper.ai/Py1l3

2. 헤르메스 작동 튜토리얼
Hermes Agent는 Nous Research 팀이 2026년에 개발한 오픈 소스 자율 진화형 AI 에이전트입니다. 이 프로젝트의 핵심 기능은 내장된 학습 루프입니다. 작업 경험을 통해 자동으로 기술을 습득하고, 사용 중에 지속적으로 개선되며, 지식을 메모리 시스템에 능동적으로 저장하고, 과거 대화를 검색하여 대화를 통해 사용자에 대한 깊은 이해를 점진적으로 구축할 수 있습니다. 이 웹사이트는 GPU와 CPU 모두에서 Hermes를 실행하는 방법에 대한 튜토리얼을 제공합니다.
GPU 버전 온라인 실행 중:https://go.hyper.ai/nnyFT
온라인 CPU 버전:https://go.hyper.ai/kdo9i

3. DeepSeek-V4-Flash의 원클릭 배포
DeepSeek V4는 DeepSeek 팀에서 출시한 최신 대규모 언어 모델로, DeepSeek-V4-Pro(1.6조 파라미터)와 DeepSeek-V4-Flash(2억 8천 5백만 파라미터) 두 가지 버전이 있습니다. DeepSeek V4는 완전히 새롭고 매우 효율적인 장문 컨텍스트 어텐션 메커니즘을 채택하여 최대 100만 토큰의 컨텍스트 길이를 기본적으로 지원하며, 특히 초장문 텍스트 처리 작업에 특화되어 설계되었습니다.
온라인으로 실행:https://go.hyper.ai/sFyxU

4. Free-CPU를 사용하여 MOSS-TTS-Nano를 배포합니다.
MOSS-TTS-Nano는 OpenMOSS 팀에서 2026년 4월에 출시한 0.1B 파라미터의 다국어 텍스트 음성 변환 모델입니다. CPU 환경에서 음성 생성 및 복제를 지원합니다. 이 모델은 텍스트 음성 변환의 자연스러움, 다국어 사용성, 참조 오디오 기반 음색 전송 기능을 균형 있게 고려하여 설계되었으며, 기본적인 읽기부터 음성 복제에 이르기까지 다양한 일반적인 작업을 처리할 수 있습니다.
온라인으로 실행:https://go.hyper.ai/CwMEH

커뮤니티 기사 해석
1. 영국 연구팀은 적층형 앙상블 학습을 사용하여 델타 스쿠티 별 251개의 지진 지수를 매우 정확하게 예측하는 데 성공했습니다.
영국 워릭대학교의 연구팀이 TESS 광도 곡선을 이용하여 델타 스쿠티 별의 주요 성진동 매개변수를 직접 예측하는 스택형 앙상블 학습 프레임워크를 개발했습니다. 이 방법은 643개의 별 샘플에서 놀라운 결과를 보여주었습니다. 모든 목표 매개변수에 대한 결정계수(R²)는 0.77 이상이었으며, 훈련에 사용되지 않은 60개의 별에 대해서도 우수한 일반화 능력을 나타냈습니다. 예측 결과는 기존의 성진동 분석 결과와 매우 일치했습니다.
전체 보고서 보기:https://go.hyper.ai/mNGlM
인기 백과사전 기사
1. 기술
2. 하이퍼네트워크
3. 시그모이드 함수
4. 상호 랭크 융합
5. 다중 에이전트 아키텍처
다음은 "인공지능"을 이해하는 데 도움이 되는 수백 가지 AI 관련 용어입니다.
위에 적힌 내용은 이번 주 편집자 추천 기사의 전체 내용입니다. hyper.ai 공식 웹사이트에 포함시키고 싶은 리소스가 있다면, 메시지를 남기거나 기사를 제출해 알려주세요!
다음주에 뵙겠습니다!
HyperAI 소개
HyperAI(hyper.ai)는 중국을 선도하는 인공지능 및 고성능 컴퓨팅 커뮤니티입니다.우리는 중국 데이터 과학 분야의 인프라가 되고 국내 개발자들에게 풍부하고 고품질의 공공 리소스를 제공하기 위해 최선을 다하고 있습니다. 지금까지 우리는 다음과 같습니다.
* 2100개 이상의 공개 데이터 세트에 대한 국내 가속 다운로드 노드를 제공합니다.
* 700개 이상의 고전 및 인기 온라인 강좌가 포함되어 있습니다.
* 300개 이상의 AI4Science 논문 사례 분석
* 700개 이상의 관련 용어 검색을 지원합니다.
* 중국에서 최초의 완전한 Apache TVM 중국어 문서 호스팅
학습 여정을 시작하려면 공식 웹사이트를 방문하세요.








