Hugging Face、AIでデータセットを操作できる「AI Sheets」を発表——オープンモデルで無コードでデータ加工可能
Hugging Faceが新しく公開した「AI Sheets」は、AIモデルを活用してデータセットを構築・変換・拡張できる無コードツールです。このツールは、Hugging Face Hubと連携し、オープンソースのAIモデルやローカルモデル、OpenAIのgpt-ossなど、数千種類のモデルを簡単に利用できます。ユーザーはスプレッドシートのように直感的なインターフェースで操作でき、プロンプトを入力するだけで新しい列を追加し、データをリアルタイムで改善・検証できます。 主な用途は多岐にわたります。例えば、複数のAIモデルの性能を比較する「モデル比較実験」、特定のタスク向けにプロンプトを最適化する「プロンプトの改善」、テキストのクリーニングや分類、カテゴリ付け、要約、データの豊かさ向上(例:住所から郵便番号を自動抽出)など、データ処理のあらゆる場面で活用可能です。また、プライバシー保護の観点から実際のデータが入手困難な場合でも、AIでリアルな合成データ(例:医薬業界の人物プロフィールやメール文)を生成できます。 使い方は簡単です。データをCSVやExcel形式でアップロードするか、自然言語でデータ構造を記述して「スクラッチから生成」することも可能です。生成されたデータは、セルを直接編集したり、良い結果に「いいね」を押すことで、AIにフィードバックとして学習させることができます。これにより、再生成時により正確な出力が得られます。 さらに、最終的なデータセットはHugging Face Hubにエクスポートでき、生成用の設定ファイル(config)も自動生成されるため、後続のデータ生成ジョブやアプリケーション開発で再利用が可能。HF Jobsと連携すれば、1,000行以上の大量データ生成も実現できます。 このツールは、AIを活用したデータ処理の入門者から専門家まで幅広く利用でき、特にAIモデルの評価(LLM-as-Judge)、データの品質改善、プロトタイピングに最適です。無料で利用可能で、ローカルインストールも可能。プロのユーザー向けには、推論リソースを20倍に増やす「PRO」プランも提供されています。