AI Sheets 正式发布:开源 AI 驱动的数据处理新工具
1 个月前
Hugging Face推出全新开源工具AI Sheets,一款无需编码即可使用AI模型处理数据集的可视化工具。该工具支持本地部署或通过Hugging Face Hub在线使用,可调用数千个开源模型,包括OpenAI的gpt-oss等,助力用户高效构建、增强和转换数据。 AI Sheets界面类似电子表格,操作直观。用户可通过编写提示词(prompt)快速生成新列,支持实时迭代与手动编辑,系统会将修改后的单元格自动作为“少样本示例”用于后续生成,显著提升结果质量。它适用于多种场景:测试不同模型表现、优化提示词、清洗数据、分类文本、提取核心观点、补充缺失信息(如自动补全邮编)、生成合成数据(如虚构的职场人物简介和邮件)等。 使用方式灵活,支持从零创建数据集或导入CSV、TSV、XLS、Parquet等格式文件,最多支持1000行数据。导入后可在表格中直接编辑、扩展行数、调整提示词、切换模型或启用网页搜索功能。完成数据处理后,可一键导出至Hugging Face Hub,并生成可复用的配置文件,便于后续通过HF Jobs任务自动化生成更大规模数据集。 该工具特别适合AI研究人员、数据工程师和开发者进行快速原型设计、模型对比和数据增强。例如,可同时运行多个模型生成代码并用LLM作为裁判评估优劣;也可为现有数据集添加分类标签,通过人工反馈持续优化模型输出。 目前AI Sheets已开放免费试用,无需安装即可体验。如需更高性能,可订阅PRO版本以获得20倍的推理额度。项目源码已开源,欢迎在社区或GitHub提交建议与反馈。