HyperAI
Back to Headlines

بايتแดนس تطلق سيد-كوذر: نموذج لغوي مركزي يعتمد على البيانات لإتقان مهام البرمجة بـ 6 تريليون رمز

منذ يوم واحد

بايت دانس تطلق سي드-كودر: نموذج لـ LLM مركزي للبرمجة مدرب على 6 تريليون رمز إعادة تعريف تدريب نماذج لغة البرمجة عبر خطوط بيانات قابلة للتوسع وأتمتتها لعبت البيانات البرمجية دورًا محوريًا في تدريب نماذج اللغات الكبيرة (LLMs)، مما أسهم في تحسين قدراتها على البرمجة وكذلك في مهارات التفكير الأوسع. ومع ذلك، تواجه العديد من النماذج المفتوحة المصدر تحديات كبيرة في تجميع بيانات البرمجة، حيث تعتمد على المرشحات اليدوية والقواعد التي يصممها الخبراء. هذه الطرق تستغرق وقتًا طويلاً، وتكون منحازة، وصعبة التطبيق على نطاق واسع عبر多种语言.虽然专有模型如Claude 3.7和OpenAI o3在编程任务中表现出色,但它们不分享其数据的详细信息。即使是开源模型,如DeepSeek和Qwen2.5,仍然严重依赖人类设计的过滤器,这种依赖性限制了进展,呼应了“苦涩的教训”,即真正的突破来自可扩展的数据驱动方法,而不是手工制作的启发式方法。 سيد-كودر: خط أنابيب مركزي للنموذج يقلل من تدريب ما قبل التعلم اليدوي باحثو بايت دانس قدموا سيد-كودر، وهي سلسلة من 8 مليار نموذج مفتوح المصدر تشمل النموذج الأساسي، نموذج التعليمات، ونموذج التفكير. هذه النماذج مصممة لتقليل تدخل البشر في جمع بيانات البرمجة. بدلاً من الاعتماد على القواعد اليدوية، يستخدمون خط أنابيب مركزي للنموذج يستفيد من نماذج اللغات الكبيرة لتصنيف وتقييم كميات كبيرة من بيانات البرمجة من مصادر مثل جيت هاب والمواقع المتعلقة بالبرمجيات، مما أدى إلى بناء مجموعة بيانات تحتوي على حوالي 6 تريليون رمز. يتم تدريب النموذج الأساسي في مرحلتين: الأولى باستخدام البيانات الأساسية من البرمجة والمواقع، والثانية باستخدام هياكل أكثر تعقيدًا مثل المستودعات الكاملة ومهمات السياق الطويل مثل "填补中间",以提高模型的编码能力。 通过指令调优和LongCoT进行后训练,实现多步代码理解 在预训练之后,Seed-Coder通过两个后训练阶段进一步改进。首先,使用由LLM生成并筛选的各种合成指令数据进行监督微调,帮助模型更好地理解和遵循人类提示。然后,通过直接偏好优化(DPO)增强其性能,使模型响应更符合人类偏好。对于复杂的推理任务,使用长链思维(LongCoT)强化学习来改善推理模型,这加强了其处理多步编码挑战的能力。这些步骤显著提高了Seed-Coder在各种代码生成和推理任务中的表现。 Seed-Coder在代码生成、编辑和多步推理基准测试中表现出色 评估结果显示,Seed-Coder的三个模型——基础模型、指令模型和推理模型——在广泛的编码任务中表现出色。基础模型在代码生成任务上超越了其他类似规模的开源模型,在HumanEval和MultiPL-E等基准测试中取得了优异成绩。指令模型在需要代码编辑和指令遵循的任务中表现出色,在CodeEditorBench和FullStack等评估中领先。推理模型通过长链思维技术训练,展示了出色的多步问题解决能力,特别是在LiveCodeBench和Codeforces等具有挑战性的基准测试中,甚至超过了规模大几倍的模型。 الخلاصة سيد-كودر هي عائلة من النماذج اللغوية عالية الكفاءة والمفتوحة المصدر المصممة خصيصًا للمهام البرمجية. تتميز هذه النماذج بالاعتماد الكبير على نماذج اللغات الكبيرة بدلاً من البشر في فرز وجمع بيانات التدريب، مما يقلل بشكل كبير من الجهود اليدوية. رغم أنها在较少的标记上进行了训练,与一些更大的模型相比,仍然在代码生成、完成、编辑和推理任务中表现出卓越性能。然而,由于缺乏广泛网络数据和数学内容,其在通用语言理解方面的能力仍有限。未来的更新计划扩展模型系列并提高不同模型规模的能力。 تقييم الحدث من قبل المختصين خبراء في مجال الذكاء الاصطناعي والبرمجة قد أشادوا بسيد-كودر لابتكاره في استخدام نماذج اللغات الكبيرة لفرز البيانات بدلاً من الأساليب التقليدية. هذا النهج يفتح الباب أمام تطوير نماذج أفضل وأكثر كفاءة في المستقبل. كما أن إتاحة هذه النماذج للجمهور يشجع المزيد من البحث والتطوير في مجال الذكاء الاصطناعي البرمجي. نبذة تعريفية عن بايت دانس بايت دانس هي شركة تكنولوجيا صينية تأسست عام 2012. تشتهر بتطبيقاتها الشهيرة مثل تيك توك ودوين، ولكنها أيضًا لها بصمات في مجال الذكاء الاصطناعي والتعلم العميق. أبحاثها في هذا المجال تهدف إلى تطوير تقنيات مبتكرة تسهل استخدام الذكاء الاصطناعي في التطبيقات العملية، مثل البرمجة والترجمة والتفاعل البشري-الكمبيوتر.

Related Links