5 دروس من شركة Ordnance Survey لبناء نماذج أساسية لذكاء الاصطناعي
خمس نصائح لبناء نماذج أساسية للذكاء الاصطناعي تعاني العديد من الشركات من التكيف مع تأثير الذكاء الاصطناعي (AI)، بينما استخدم بعضها تقنيات التعلم الآلي (ML) وغيرها من التقنيات الناشئة لمدة تزيد عن عقد من الزمن. ومن بين هؤلاء، منيش جيثوا، الرئيس التنفيذي للتكنولوجيا في خدمة الخرائط الوطنية البريطانية (Ordnance Survey - OS)، والذي يركز على دمج خبرات شركته في مجال الذكاء الاصطناعي والتعلم الآلي مع التطورات الأخيرة في الذكاء الاصطناعي التوليدي لتحسين وتوزيع وتطبيق كنوز البيانات التي تملكها المنظمة. 1. تطوير حالة استخدام قوية قال جيثوا إن OS تعمل على تطوير نماذج أساسية لاستخراج الميزات البيئية بطريقة تحترم حقوق النشر.许多已有的大型科技公司训练的模型都是基于商业数据。"OS 的优势在于其长期的高精度数据收集,这些数据为组织的 AI 发展提供了支持。"当我们试图提取特征时,我们从头开始构建基础模型,"他说。"这意味着我们使用内部已标记的数据来定义完整的训练集。"这些基础模型还用于其他领域的数据分析。通过这种方法,我们可以将问题与源数据连接起来,而无需反复训练多个基础模型。 2. 建立有目的的方法 吉思瓦表示,有针对性的训练有助于在构建基础模型时控制成本。"我们必须意识到,在训练这些模型时需要有目的性,因为学习过程会浪费很多计算周期,"他说。"执行这些模型所需的能量和资源远少于实际训练所需。"OS 通常以小块的形式向模型提供训练数据。"建立标签数据集需要相当长的时间,"他补充道。"你必须在全国范围内整理数据,涵盖你试图从中学习的各种类别,如城市和农村的比例不同等。"首先,OS 构建一个使用几百个示例的小型模型。这种方法有助于控制成本,并确保 OS 正朝着正确的方向前进。"然后我们逐渐增加已标记的示例数量,"吉思瓦说。"我们现在已经有几十万个已标记的示例,而这些模型通常需要数百万个已标记的数据集进行训练。"尽管组织的模型较小,但结果令人印象深刻。"我们已经超越了大型提供商现有的模型,因为这些模型是在更广泛类型的图像上训练的,"他说。"这些模型可能解决了更广泛的问题,但在我们的特定领域,即使规模较小,我们也优于它们。" 3. 使用其他大语言模型进行微调 吉思瓦指出,尽管 OS 使用自己的基础模型,但这并不意味着组织忽视了知名的大语言模型 (LLMs)。"我们在现有模型的基础上进行微调,这基于我们的文档,"他说。OS 利用了市场上所有可用的大语言模型,包括基于 Azure 的机器学习模型、Python 工具和其他专业功能。同时,OS 还探索与其他外部组织的合作,如 IBM 和其他技术供应商,以生成针对数据驱动挑战的协作解决方案。"这是一种理性化努力,"吉思瓦说。"在内部,主要方法是逐步构建,确保目标是可实现的,并且不会因无效活动浪费资源。" 4. 考虑商业化 随着 OS 开始构建和改进其基础模型,这些技术是否可以被其他组织使用或出售?吉思瓦的回答是:可能。其中一个关键问题是王室版权,这是适用于英国公共部门员工创作资产的一种版权形式。"我认为将来有机会分享这些基础模型,但由于它们是基于王室版权构建的,我们仍在尝试理解对外部工作的潜在影响,"他说。"这里存在挑战,尤其是在保护我们的数据方面,同时也要确保英国纳税人从中受益。"当 OS 提供开放访问时,吉思瓦说,必须防止数据被收集和货币化而不产生对英国纳税人的利益。"我们在尽可能保护数据的同时,也要最大化其对英国的价值,这是一个挑战,"他说。 5. 展望未来 吉思瓦表示,组织在基础模型上的工作证明了生成式 AI 在开放深度洞察方面的价值。"它提供了关键的解锁,使你可以通过互动、获取数据和优化请求的方式以前所未有的方式访问数据,"他说。他描绘了 OS 在未来十年如何发展 AI 方法的图景。"我想象一个界面,那里有一张地图,你可以选择一个感兴趣的区域,放大,AI 会问‘你具体在寻找什么?’当你回答‘学校’时,AI 会进一步询问是什么类型学校,然后你会通过界面进行对话。"长期成功的秘诀是使用 API 和数据从权威来源生成明确答案。"AI 模型在聚合和概率视图方面表现很好,但在我们的例子中,你不想知道学校的位置概率,而是想知道实际学校的位置,"他说。"AI 必须将真实请求转化为回溯到权威来源的操作,而 OS 就是这样的权威来源,我们可以提取数据并交付输出。" تقييم الحدث من قبل مختصين يؤكد جيثوا على أهمية بناء نماذج أساسية قوية وموجهة لتحقيق أهداف محددة، مما يسهم في تحسين الكفاءة وتقليل التكلفة. كما يشير إلى القيمة المحتملة للتعاون مع شركات خارجية وأهمية الحفاظ على البيانات الحساسة. هذه النصائح يمكن أن تكون مفيدة للشركات التي تسعى إلى تبني الذكاء الاصطناعي بشكل فعال ومربح. نبذة تعريفية عن شركة Ordnance Survey خدمة الخرائط الوطنية البريطانية (Ordnance Survey - OS) هي الجهة المسؤولة عن رسم الخرائط الرسمية في المملكة المتحدة. تشتهر OS بجودة بيانات الخرائط الخاصة بها وتطبيقاتها الواسعة في مجالات مثل التخطيط الحضري، إدارة الكوارث، والبحث العلمي. تعمل المنظمة على دمج الذكاء الاصطناعي في خدماتها لتوفير حلول أكثر تقدمًا وفعالية.