HyperAIHyperAI

Command Palette

Search for a command to run...

ローカルで実行可能なプライバシー検出モデル:Privacy Filterは、低コストで高品質な個人情報フィルタリングを実現します。本格的なオープンソースです!8万試合以上を収録したTransfermarktの構造化サッカーデータセットをカバーしています。

Featured Image

Privacy Filterは、OpenAIが開発したオープンソースの双方向ラベリングおよび分類モデルで、高スループットデータのクリーニングを目的としています。テキスト中の個人識別情報(PII)を効率的に検出し、マスキングするために使用されます。gpt-ossに似た小規模な事前学習済みアーキテクチャに基づいており、従来の単語ごとの生成方法は採用していません。代わりに、制約付きビタビアルゴリズムと組み合わせた単一の順伝播によって、入力シーケンスの連続したセグメントを直接デコードします。

現在、HyperAIのウェブサイトでは[該当するセクション/機能]が公開されています。プライバシーフィルターモデルぜひお試しください!

オンラインでの使用:https://go.hyper.ai/Py1l3

hyper.aiの公式サイトにおける4月25日から4月30日までの更新内容の概要は以下のとおりです。

* 高品質の公開データセット: 5

* 厳選された高品質チュートリアル:5つ

* コミュニティ記事分析:1件

* 人気のある百科事典のエントリ: 5

公式ウェブサイトにアクセスしてください:ハイパーアイ

公開データセットの選択

1. Transfermarkt Football データセット

Transfermarkt Footballは、Transfermarkウェブサイト上に構築された、構造化されたサッカー移籍市場データセットであり、スポーツ分析とデータモデリング向けに設計されています。このデータセットには、8万試合以上のサッカーの試合、400のクラブ、3万7千人以上の選手が含まれており、選手の市場価値の変化、出場記録、移籍活動などが記録されています。

オンラインでの使用:https://go.hyper.ai/lF661

2. ヨガトレーニング:ヨガのポーズ分類とトレーニングデータセット

Yoga Trainingは、ヨガのポーズ分類のためのデータセットであり、主に画像分類、姿勢認識、軽量深層学習トレーニング、および転移学習実験に使用されます。このデータセットには、幅広い難易度とポーズカテゴリを網羅した1,771枚のヨガポーズのサンプル画像が含まれています。

オンラインでの使用:https://go.hyper.ai/hVdM8

3. トウモロコシの葉の病気データセット

トウモロコシ葉病害データセットは、精密農業における対象物検出タスクのために特別に設計されたトウモロコシ葉画像のデータセットです。このデータセットには、健康なトウモロコシ葉と、さび病、灰色斑点病、萎凋病という3つの一般的な病害を含む4つのカテゴリを網羅した、4,027枚のトウモロコシ葉画像が含まれています。

オンラインでの使用:https://go.hyper.ai/UbRRp

4. リンゴの葉の病気データセット

「リンゴ葉病害」は、精密農業における対象物検出タスク向けに特別に設計された、高品質なリンゴ葉画像データセットです。このデータセットには、健康なリンゴの葉と、黒腐病、杉さび病、黒星病という3つの一般的な病気の4つのカテゴリを網羅した、3,444枚のリンゴ葉画像が含まれています。

オンラインでの使用:https://go.hyper.ai/LDafw

5. 薬剤有害事象検出データセット

薬剤有害事象検出は、患者に対する複数の薬剤処方を含む現実世界のシナリオをシミュレートしたテキストデータセットです。複数の薬剤の併用によって引き起こされる薬剤有害反応のリスクを研究することを目的としており、薬剤有害反応検出、医療情報抽出、臨床テキスト分析、医療AIモデルのトレーニングなど、幅広い用途があります。

オンラインでの使用:https://go.hyper.ai/AlL32

選択された公開チュートリアル

1. プライバシーフィルタモデル

OpenAI Privacy Filterは、OpenAIが2026年4月にリリースした双方向トークン分類モデルで、テキスト内の個人識別情報(PII)を検出してマスキングするために使用されます。このモデルはgpt-ossに似たアーキテクチャを採用していますが、規模は小さくなっています。公式のモデルカードの説明によると、パラメータの総数は約15億、アクティブなパラメータは約5000万、最大12万8000のトークンコンテキストをサポートし、33個のBIOESトークンレベルラベルを通じてプライバシーフラグメント境界を出力します。

オンラインで実行:https://go.hyper.ai/Py1l3

デモページ

2. Hermesの操作チュートリアル

Hermes Agentは、2026年にNous Researchチームによって開発された、オープンソースの自己進化型AIエージェントです。このプロジェクトの中核となる機能は、内蔵された学習ループです。タスク経験からスキルを自動的に生成し、使用中に継続的に改善し、知識を積極的にメモリシステムに保持し、過去の会話を検索して、会話を通してユーザーに対する深い理解を徐々に構築していきます。このウェブサイトでは、HermesをGPUとCPUの両方で実行するためのチュートリアルを提供しています。

GPU バージョンのオンライン実行:https://go.hyper.ai/nnyFT

オンラインCPU版:https://go.hyper.ai/kdo9i

デモページ

3. DeepSeek-V4-Flashのワンクリック展開

DeepSeek V4は、DeepSeekチームがリリースした最新世代の大規模言語モデルで、DeepSeek-V4-Pro(1.6Tパラメータ)とDeepSeek-V4-Flash(285Bパラメータ)の2つのバージョンがあります。DeepSeek V4は、最大100万トークンのコンテキスト長をネイティブにサポートする、全く新しい高効率な長文コンテキスト注意機構を採用しており、特に超長文テキストの処理に特化して設計されています。

オンラインで実行:https://go.hyper.ai/sFyxU

デモページ

4. Free-CPUを使用してMOSS-TTS-Nanoをデプロイする

MOSS-TTS-Nanoは、OpenMOSSチームが2026年4月にリリースした、パラメータ数0.1Bの多言語テキスト音声合成モデルです。CPU環境での音声生成と音声クローン生成をサポートしています。このモデルは、テキスト音声合成の自然さ、多言語対応性、および参照音声に基づく音色転送機能のバランスを取るように設計されており、基本的な読み上げから音声クローン生成まで、さまざまな一般的なタスクに対応できます。

オンラインで実行:https://go.hyper.ai/CwMEH

デモページ

コミュニティ記事の解釈

1. 英国の研究チームは、スタック型アンサンブル学習を用いることで、251個のデルタ・スクティ型星の地震指数を高精度で予測することに成功した。

英国ウォーリック大学の研究チームは、TESSの光度曲線からデルタ・スクティ星の主要な星震学的パラメータを直接予測する、スタック型アンサンブル学習フレームワークを開発しました。この手法は、643個の星のサンプルにおいて目覚ましい成果を上げました。すべての目標パラメータの決定係数(R²)は0.77を超え、学習に使用されていない60個の星に対しても優れた汎化能力を示しました。予測結果は、従来の星震学的解析結果と非常に高い一致度を示しました。

レポート全体を表示します。https://go.hyper.ai/mNGlM

人気のある百科事典の項目を厳選

1. スキル

2. ハイパーネットワーク

3. シグモイド関数

4. 相互ランク融合

5. マルチエージェントアーキテクチャ

ここには何百もの AI 関連の用語がまとめられており、ここで「人工知能」を理解することができます。

https://go.hyper.ai/wiki

上記は、今週編集者が選択したすべてのコンテンツです。hyper.ai 公式 Web サイトに掲載したいリソースがある場合は、お気軽にメッセージを残すか、投稿してお知らせください。

また来週お会いしましょう!

HyperAIについて Hyper.ai

HyperAI(hyper.ai)は、中国をリードする人工知能とハイパフォーマンス・コンピューティングのコミュニティである。国内データサイエンス分野のインフラとなり、国内開発者に豊富で質の高い公共リソースを提供することに注力しています。

* 2100以上の公開データセット向けに、国内高速ダウンロードノードを提供

* 700以上の定番かつ人気のオンラインチュートリアルを収録

* 300件以上のAI4Science論文事例を分析

* 700以上の関連用語の検索に対応

*Apache TVM の最初の完全な中国語ドキュメントを中国でホストします

学習の旅を始めるには、公式 Web サイトにアクセスしてください。

https://hyper.ai