HyperAI超神经
Back to Headlines

TELUS Digital 调查显示:AI 信任度与数据来源密切相关,高质量 STEM 数据集需求激增

a day ago

随着生成式人工智能(Generative AI,简称GenAI)在各个行业的应用不断加速,数据来源的透明度和质量越来越成为企业使用AI的关键因素。根据TELUS Digital最近的一项调查,有87%的美国成年人认为公司应公开数据源信息,这一比例较2023年的75%显著提升。此外,65%的受访者认为,如果排除高质量的验证内容(如《纽约时报》、路透社、彭博社等可信媒体的信息),可能导致大语言模型(LLM)的响应不准确或存在偏见。 对此,TELUS Digital的全球副总裁兼总经理Amith Nair指出:“在AI系统逐渐专业化并应用于高风险领域的背景下,数据集的质量成为了企业能否实现实际效果的重要分水岭。互联网或普通众包数据已经无法满足当今企业复杂和专业化的应用需求。客户的需求正从‘群体智慧’转向‘专家智慧’。专家和行业专业人士通过精心整理数据集,确保其技术性和上下文相关性,并负责任地构建。” 为了应对这一趋势,TELUS Digital推出了13个即用型STEM(科学、技术、工程和数学)数据集,涵盖了编码和推理等对LLM发展至关重要的数据。这些数据集由来自全球各地的Ph.D.研究员、教授、研究生和专业人士精心整理,确保数据的质量、准确性和适用性。企业可以立即在AI训练流程中集成这些数据集,从而提高模型的性能和可靠性。 多位参与TELUS Digital数据标注项目的专家分享了他们的看法。例如,Dancan是一名背景为有机化学的AI科学家,也是TELUS Digital的自由职业数据标注员。他提到:“通过正确标注数据,我们使AI能够更有效地与科学家合作,简化流程,加快解决方案的发现速度,降低成本。特别是对于寻找生命拯救疗法的研究,这具有重要意义。” Sourabh则是一名来自印度的软件工程师,他表示:“结合我在软件领域的背景,我可以在数据标注项目中解决代码挑战问题,通过逐步解释来影响模型的学习和功能。” Justin博士是佛蒙特大学化学系的博士候选人,他强调:“高质量的数据标注能够显著降低即使是经验丰富的科学家进入新项目的门槛,从而促进更高效和深刻的科技创新。” TELUS Digital拥有超过20年的数据标注经验,建立了一个覆盖多个复杂领域的全球专家网络。除了即用型数据集,公司还提供完全定制的AI数据项目,以满足客户的特定需求、行业要求和语言需求。这些服务包括多语言和多模态标注,以及对需要高度准确性和合规性的行业提供专门支持。 TELUS Digital的数据标注服务基于其先进的专有平台Ground Truth(GT)Studio,该平台通过智能化自动化和多元化的人类专业知识,确保数据的高度质量和准确性。公司推出的即用型STEM数据集包括超过178,000个结构化的提示-响应对,企业可以根据需求单独或整体获取这些数据集。对于需要深度定制或具体应用场景的项目,TELUS Digital提供量身定制的数据集,严格符合特定的使用场景和监管要求。 总的来看,TELUS Digital的做法体现了数据标注和管理在AI发展中日益重要的地位。通过专业人员的精心策划和标注,企业不仅能够在技术上取得突破,还能更好地应对社会伦理和技术安全的挑战。 业内评价: 业内人士普遍认为,TELUS Digital通过引入专家知识和专业数据集,有效地提高了AI模型的准确性和可靠性。特别是在高风险领域如医疗和金融,这种做法更是显得尤为关键。TELUS Digital在全球数据管理和服务方面积累的丰富经验,使其成为推动AI技术负责任发展的领先企业之一。

Related Links