HyperAI

现代组织通过调查、支持工单和产品评论等方式不断收集客户反馈。然而，这些反馈大多是非结构化的，涉及多种语言，且难以手动处理。如果没有自动化工具，理解和响应客户需求将非常耗时，限制团队快速反应的能力。为了解决这一问题，利用Databricks的AI平台能力和生成式AI模型（如LLM）进行批处理推理成为了一种高效的解决方案。什么是批处理推理？批处理推理是指一次性将机器学习模型（如大型语言模型）应用于大量数据集，而不是实时处理。这种方法特别适用于处理历史数据或定期更新的数据集，比如每周导出的调查结果或每月的客户评论。在Databricks中，可以使用SQL原生函数如ai_query()和ai_translate()直接在工作流中应用这些模型，无需外部API或自定义ML基础设施。示例项目流程舞台设置：构建样本调查为了展示这一工作流，我们使用Google Forms构建了一个样本调查，其中包括5个问题： 1. 您对我们服务的满意度如何？ 2. 您最喜欢什么？ 3. 我们可以改进什么？ 4. 您有多大可能推荐我们给朋友或同事？ 5. 有其他评论吗？我们生成了英文、西班牙文、中文、法文和日文的回答，模拟真实世界中的多语言反馈多样性。第一步：使用Auto Loader进行增量加载我们首先将每批次的调查结果保存为CSV文件并上传到Databricks Volume中，然后使用Auto Loader将数据增量地加载到Delta表中。Auto Loader确保新文件只被处理一次，支持模式演化，非常适合生产环境中的数据管道。第二步：使用ai_translate()翻译回答接着，我们使用ai_translate()函数将非英文反馈翻译成英文。这样，我们可以访问原始和翻译后的版本，保持透明度和可追溯性。第三步：标准化和准备数据有了翻译后的内容，我们构建了一个视图，将所有下游分析的标准语言统一为英文。通过合并原始和翻译列，确保每条记录都是完整且准备好进行推理的。第四步：使用ai_query()和LLaMA 3生成洞察最令人兴奋的部分是利用大型语言模型提取洞察。ai_query()函数允许我们在SQL查询中嵌入自然语言提示，从而为每个客户反馈提取以下信息： - 满意度评分 - 正面反馈的关键点 - 改进建议 - 推荐可能性评分 - 其他评论的总结这些洞察可以帮助产品经理和支持团队基于真实的客户数据优先处理改进事项。由于ai_query()内置于Databricks SQL中，因此无需自行托管模型或管理API，所有操作都在无服务器基础架构上自动扩展运行。第五步：在仪表板中可视化结果最后一步是将这些洞察呈现给利益相关者。我们使用Databricks SQL编辑器创建了一个仪表板，业务用户可以通过它探索随时间变化的趋势、高亮显示需改进的领域以及识别客户的痛点，而无需编写任何代码。当新的调查文件被加载时，仪表板会自动更新。专家评价与公司背景这一工作流提供了一种快速、可扩展的方法来处理和分析非结构化的调查反馈。仅需几个简单的SQL和Python命令，就能实现从数据采集到洞察生成的全过程。该方法不仅提高了效率，还使得跨功能团队能够及时获取可信的洞察。Databricks作为一家领先的数据湖和机器学习平台提供商，已经在多个行业中证明了其强大的数据分析能力。这一解决方案不仅适用于客户调查，还可以轻松扩展到产品评论、支持工单、内部员工反馈等多种应用场景。无论是哪种多语言文本数据，都可以通过这种方式自动化生成有价值的洞察。如果您想为团队构建这一系统，可以从一个包含调查响应的CSV文件开始，按照上述步骤逐步操作，您会发现自由文本中隐藏的巨大价值。

相关链接

相关链接

相关链接

字节开源 Lance，3B 模型包揽理解/生成/编辑；新加坡国立大学提出 ViMU 数据集：涵盖 588 个视频与无提示问答

字节开源 Lance，3B 模型包揽理解/生成/编辑；新加坡国立大学提出 ViMU 数据集：涵盖 588 个视频与无提示问答

Command Palette

如何在Databricks上利用AI高效解锁多语言客户洞察

相关链接

Command Palette

如何在Databricks上利用AI高效解锁多语言客户洞察

相关链接

Command Palette

如何在Databricks上利用AI高效解锁多语言客户洞察

相关链接

字节开源 Lance，3B 模型包揽理解/生成/编辑；新加坡国立大学提出 ViMU 数据集：涵盖 588 个视频与无提示问答

字节开源 Lance，3B 模型包揽理解/生成/编辑；新加坡国立大学提出 ViMU 数据集：涵盖 588 个视频与无提示问答