HyperAI
Back to Headlines

تقنية جديدة من Sakana AI تجمع قوى نماذج الذكاء الاصطناعي المختلفة لحل مشاكل معقدة بشكل أفضل بنسبة 30%

منذ 2 أيام

Sakana AI تطلق تقنية TreeQuest: فرق متعددة من نماذج اللغة تتفوق بنسبة 30% على النماذج الفردية في الثالث من يوليو عام 2025، أعلن مختبر الذكاء الصناعي الياباني Sakana AI عن تقنية جديدة تسمح للعديد من نماذج اللغة الكبيرة (LLMs) بالتعاون في مهمة واحدة، مما يخلق فريقًا ذكيًا من وكالات الذكاء الصناعي. هذه التقنية، التي تُعرف باسم Multi-LLM AB-MCTS، تمكّن النماذج من القيام بالتجربة والخطأ ودمج قدراتها الفريدة لحل المشكلات المعقدة التي تكون خارج نطاق أي نموذج فردي. قوة الذكاء الجماعي تتطور نماذج الذكاء الصناعي الرائدة بسرعة، ومع ذلك لكل نموذج نقاط قوة وضعف خاصة به، والتي تنبع من بيانات التدريب والبنية المعمارية الفريدة له. قد يتفوق نموذج ما في البرمجة، بينما يتفوق آخر في الكتابة الإبداعية. يرى باحثو Sakana AI أن هذه الاختلافات ليست عيوبًا بل موارد ثمينة لخلق ذكاء جماعي. "نرى هذه الانحيازات والقدرات المتنوعة ليس كقيود، بل كموارد ثمينة لخلق ذكاء جماعي"، قال الباحثون في مدونتهم. "كما أن أعظم إنجازات البشرية تأتي من الفرق المتنوعة، يمكن أن تحقق أنظمة الذكاء الصناعي المزيد من خلال العمل معًا". التحسين في زمن الاستدلال تعتبر تقنية Sakana AI الجديدة جزءًا من مجال البحث الذي اكتسب شعبية كبيرة في العام الماضي، وهو "التحسين في زمن الاستدلال" (inference-time scaling). بينما كان التركيز معظم الوقت في الذكاء الصناعي على "التدريب في زمن التحسين" (training-time scaling)، فإن التحسين في زمن الاستدلال يهدف إلى تحسين الأداء من خلال تخصيص المزيد من الموارد الحاسوبية بعد تدريب النموذج. تتضمن إحدى الأساليب الشائعة استخدام التعلم التقويمي لحث النماذج على إنشاء سلاسل تفكير (Chain-of-Thought - CoT) أطول وأكثر تفصيلاً، كما هو الحال في النماذج الشائعة مثل o3 من OpenAI و DeepSeek-R1. أما الطريقة البسيطة الأخرى فهي العيّنة المتكررة، حيث يتم تقديم النموذج نفس الدعوة عدة مرات لإنتاج مجموعة متنوعة من الحلول المحتملة، مشابهة لجلسة توليد أفكار. العمل بخوارزمية البحث التفرعي المتكيفة يتمثل جوهر الطريقة الجديدة في خوارزمية تُعرف بـ "البحث التفرعي مونتي كارلو المتكيف" (Adaptive Branching Monte Carlo Tree Search - AB-MCTS). تمكن هذه الخوارزمية نموذج اللغة من القيام بالتجربة والخطأ بشكل فعال من خلال الموازنة الذكية بين استراتيجيتين مختلفتين للبحث: "البحث العميق" و "البحث الواسع". يشمل البحث العميق تحسين إجابة واعدة بشكل متكرر، بينما يشمل البحث الواسع إنشاء حلول جديدة تمامًا من الصفر. تقوم AB-MCTS بدمج هاتين الاستراتيجيتين، مما يسمح للنظام بتحسين فكرة جيدة ولكنه أيضًا قادر على التغيير وتجرّب شيء جديد عند الوصول إلى الطريق المسدود أو اكتشاف اتجاه واعد آخر. لتحقيق هذا الهدف، يستخدم النظام خوارزمية مونتي كارلو للبحث عن الشجرة (Monte Carlo Tree Search - MCTS)، وهي خوارزمية اتخاذ القرار التي استخدمتها DeepMind في AlphaGo. في كل خطوة، تقرر AB-MCTS باستخدام نماذج الاحتمالات ما إذا كان من الأفضل تحسين حل موجود أو إنشاء حل جديد. قامت Sakana AI بتطوير هذه الفكرة أكثر مع Multi-LLM AB-MCTS، الذي يقرر ليس فقط "ماذا" يجب فعله (تحسين أو إنشاء) ولكن أيضًا "أي" نموذج لغة يجب أن يقوم بذلك. في بداية المهمة، لا يعرف النظام أي نموذج هو الأفضل للمشكلة. يبدأ بتجربة مزيج متوازن من النماذج المتاحة، ويتعلم مع التقدم أي النماذج هي الأكثر فعالية، مخصصة المزيد من العمل لها بمرور الوقت. اختبار الفريق الذكي للذكاء الصناعي �试验了他们的 Multi-LLM AB-MCTS 系统在 ARC-AGI-2 基准上。ARC(抽象和推理语料库)旨在测试类似人类的能力,以解决新的视觉推理问题,这使其对 AI 来说非常困难。 该团队使用了一系列前沿模型,包括 o4-mini、Gemini 2.5 Pro 和 DeepSeek-R1。 这些模型的集合能够为超过 30% 的 120 个测试问题找到正确答案,这一成绩显著优于任何单独工作的模型。该系统展示了动态分配最适合特定任务的模型的能力。在存在明确解决方案路径的任务中,算法迅速识别出最有效的 LLM 并更频繁地使用它。 更令人印象深刻的是,团队观察到模型解决了以前任何单一模型都无法解决的问题。在一个案例中,由 o4-mini 模型生成的解决方案是错误的。然而,系统将这个有缺陷的尝试传递给 DeepSeek-R1 和 Gemini-2.5 Pro,它们能够分析错误、纠正并最终产生正确的答案。 “这证明了 Multi-LLM AB-MCTS 可以灵活地结合前沿模型来解决以前无法解决的问题,通过使用 LLM 作为集体智能,推动了可实现性的极限”,研究人员写道。 从研究到实际应用 为了帮助开发人员和企业应用这项技术,Sakana AI 发布了一个名为 TreeQuest 的开源框架,该框架可在 Apache 2.0 许可下免费用于商业目的。TreeQuest 提供了一个灵活的 API,允许用户为自己的任务实现 Multi-LLM AB-MCTS,包括自定义评分和逻辑。 “虽然我们仍处于将 AB-MCTS 应用于具体业务问题的早期阶段,但我们的研究表明在多个领域具有巨大的潜力”,Akiba 说道。 除了在 ARC-AGI-2 基准上的成功应用外,该团队还能够成功将 AB-MCTS 应用于复杂算法编码任务和提高机器学习模型的准确性。 “AB-MCTS 还可以有效地应用于需要迭代试错的问题,例如优化现有软件的性能指标”,Akiba 说。“例如,它可以用于自动找到改进网络服务响应延迟的方法”。 发布实用的开源工具可能会为更强大和可靠的企业级 AI 应用程序铺平道路。 تقييم الحدث من قبل المتخصصين يُعتبر هذا التقدم في تقنية الذكاء الجماعي للذكاء الصناعي خطوة مهمة نحو تطوير أنظمة أكثر قدرة ومتانة. يعتقد العديد من الخبراء في مجال الذكاء الصناعي أن هذا الأسلوب سيفتح الباب أمام تطبيقات جديدة في الشركات، حيث يمكن الجمع بين قوة المنطق والثبات، وهو أمر حاسم في السياق التجاري. نبذة عن Sakana AI Sakana AI هو مختبر ياباني متخصص في تطوير تقنيات الذكاء الصناعي المبتكرة. يركز المختبر على تحسين الأداء وتوفير حلول متكاملة للأعمال. من خلال إطلاق TreeQuest، يسعى Sakana AI إلى تسهيل استخدام تقنياتهم من قبل المطورين والشركات، مما قد يؤدي إلى تطور كبير في مجال الذكاء الصناعي وتطبيقاته العملية.

Related Links