HyperAI

OpenAI は「Privacy Filter」と呼ばれる新しいオープンウェイトモデルを発表しました。このモデルは、テキスト内の個人を特定できる情報（PII）を検出し、自動的に伏字化する専用ツールとして設計されています。今回のリリースは、開発者が AI を安全に活用するためのインフラを整えるという OpenAI の広範な取り組みの一環です。プライバシー保護には従来の決定的なルールに基づくパターンマッチングではなく、深い文脈理解が必要です。Privacy Filter は、言語理解能力とプライバシー特化のラベルシステムを組み合わせることで、電話番号やメールアドレスといった形式的な情報だけでなく、文脈によっては保護が必要な微妙な個人情報も正確に識別します。また、公にすべき情報と個人に属する情報を区別する判断力も備えています。このモデルの最大の特徴は、小規模でありながら最先端の性能を維持している点です。パラメータ数は総計 15 億、アクティブなパラメータ数は 5,000 万に抑えられており、ローカル環境で実行可能となっています。これにより、データを外部サーバーに送信せずにデバイス上で処理でき、プライバシーリスクを大幅に低減できます。検出対象はアカウント番号、暗号、API キーなど 8 つのカテゴリに分類され、BIOES スパンタグを用いて一貫性の高い結果を出力します。評価では、修正後の PII-Masking-300k ベンチマークで F1 スコア 97.43% を達成しました。また、少量のデータでファインチューニングを行うと、特定ドメインでの精度も急速に向上することが確認されています。ただし、このモデルは完全な匿名化ツールやコンプライアンスの保証ではなく、法的・医療的・金融的などの高感度分野では人間のレビューとドメイン固有の評価が依然として不可欠です。モデルは誤検知や見落としの可能性を有しており、組織ごとに異なるポリシーに基づいた調整が推奨されます。現在、このモデルは Apache 2.0 ライセンスの下で Hugging Face と GitHub で利用可能であり、実験、カスタマイズ、商用展開が認められています。OpenAI は、AI が世界の知識を学ぶ一方で、個人のプライバシーを侵害しないよう、透明性の高いプライバシー保護インフラの提供を継続して目指しています。

関連リンク

関連リンク

関連リンク

ByteDanceは、理解、生成、編集の3つの要素を含む3BモデルであるLanceをオープンソース化した。シンガポール国立大学は、588本の動画と非言語的な質問応答を網羅したViMUデータセットを提案した。

ByteDanceは、理解、生成、編集の3つの要素を含む3BモデルであるLanceをオープンソース化した。シンガポール国立大学は、588本の動画と非言語的な質問応答を網羅したViMUデータセットを提案した。

Command Palette

OpenAI、プライバシーフィルター機能を導入

関連リンク

Command Palette

OpenAI、プライバシーフィルター機能を導入

関連リンク

Command Palette

OpenAI、プライバシーフィルター機能を導入

関連リンク

ByteDanceは、理解、生成、編集の3つの要素を含む3BモデルであるLanceをオープンソース化した。シンガポール国立大学は、588本の動画と非言語的な質問応答を網羅したViMUデータセットを提案した。

ByteDanceは、理解、生成、編集の3つの要素を含む3BモデルであるLanceをオープンソース化した。シンガポール国立大学は、588本の動画と非言語的な質問応答を網羅したViMUデータセットを提案した。