HyperAI

تم إطلاق نموذج GPT-5.1-Codex-Max، الجديد والأكثر تطورًا في سلسلة نماذج Codex، كخطوة متقدمة نحو نماذج ذكاء اصطناعي قادرة على أداء مهام برمجية معقدة بشكل مستقل وطويل الأمد. تم تدريب النموذج على مهام حقيقية في هندسة البرمجيات مثل إنشاء طلبات الدمج (PR)، مراجعة الكود، تطوير واجهات أمامية، والإجابة على الأسئلة، مما يجعله أكثر ذكاءً وكفاءة من النماذج السابقة في التقييمات المتقدمة. يتميز GPT-5.1-Codex-Max بقدرات استثنائية في التعامل مع المهام الطويلة عبر استخدام تقنية "الضغط" (compaction)، التي تسمح له بالعمل عبر نوافذ سياق متعددة دون فقدان الترابط أو الفهم، حتى عند التعامل مع ملايين الرموز في مهمة واحدة. هذه الميزة تفتح الباب أمام إعادة هيكلة مشاريع كاملة، جلسات تصحيح أخطاء متعمقة، وعمليات وكيل (agent loops) تمتد لساعات، وهي أمور كانت مستحيلة سابقًا بسبب حدود النافذة السياقية. أظهر النموذج تحسنًا كبيرًا في الكفاءة من حيث استخدام الرموز، حيث حقق أداءً أفضل في اختبار SWE-Bench Verified بمستوى تفكير "متوسط"، مع استخدام 30% أقل من الرموز التفكيرية مقارنة بالنموذج السابق. كما تم تقديم مستوى جديد من التفكير المعمق يُعرف بـ "xhigh"، والذي يتيح للنموذج التفكير لفترات أطول لتحقيق إجابات أكثر دقة، رغم أن التوصية الرسمية تبقى باستخدام المستوى المتوسط كخيار يومي للإنتاجية المثلى. يتوفر النموذج حاليًا في أدوات Codex عبر واجهة سطر الأوامر (CLI)، وإضافة المحرر (IDE)، والبيئة السحابية، وأدوات مراجعة الكود، مع إتاحة الوصول عبر واجهة برمجة التطبيقات (API) قريباً. ويُعد هذا النموذج أول نموذج لدينا مُدرّب خصيصًا للعمل في بيئات Windows، مع تحسينات في التعاون ضمن CLI. على الصعيد الأمني، يُعتبر GPT-5.1-Codex-Max الأقوى في مجال الأمن السيبراني بين النماذج المُتاحة، رغم أنه لم يصل بعد إلى مستوى "عالي" وفقًا لإطار جاهزية الأمان. ومع ذلك، تُبذل جهود حثيثة لتعزيز الحماية، وتعزيز أدوات الدفاع مثل مسح الثغرات تلقائيًا، ودعم مبادرات مثل Aardvark. تُستخدم نماذج Codex في بيئة مُandbox آمنة افتراضيًا، مع منع الكتابة خارج المساحة المخصصة وتعطيل الاتصال بالشبكة، ما يقلل من مخاطر التلاعب بالرسائل (prompt injection). رغم التقدم الكبير، يُنصح بإجراء مراجعة بشرية دورية لعمل النموذج قبل نشره، خصوصًا مع تزايد قدرته على العمل المستقل لفترات طويلة — حيث تم رصد حالات عمل استمرت لأكثر من 24 ساعة داخل الشركة. ويُظهر النموذج أداءً متميزًا في التقييمات التي تتطلب تفكيرًا طويل الأمد، مثل البرمجة المعقدة والأمن السيبراني. يُستخدم النموذج حاليًا كنموذج افتراضي في جميع مساحات Codex، ويُوصى باستخدامه فقط في السياقات البرمجية المتخصصة، وليس كنموذج عام. ووفقًا للمستخدمين الداخليين، فإن 95% من مهندسي OpenAI يستخدمون Codex أسبوعيًا، ويُرسلون ما يقارب 70% أكثر من طلبات الدمج منذ اعتماده. باختصار، يمثل GPT-5.1-Codex-Max تحولًا جوهريًا في قدرة الذكاء الاصطناعي على أداء مهام برمجية طويلة الأمد بدقة وكفاءة، مع تعزيز الإنتاجية الهندسية بشكل كبير، ويُعد خطوة واعدة نحو تعاون فعّال بين البشر والذكاء الاصطناعي في تطوير البرمجيات.

الروابط ذات الصلة

الروابط ذات الصلة

الروابط ذات الصلة

Command Palette

إطلاق GPT-5.1-Codex-Max: نموذج ترميز ذكي يُحدث ثورة في العمل الطويل الأمد والفعّال في تطوير البرمجيات

الروابط ذات الصلة

Command Palette

إطلاق GPT-5.1-Codex-Max: نموذج ترميز ذكي يُحدث ثورة في العمل الطويل الأمد والفعّال في تطوير البرمجيات

الروابط ذات الصلة

Command Palette

إطلاق GPT-5.1-Codex-Max: نموذج ترميز ذكي يُحدث ثورة في العمل الطويل الأمد والفعّال في تطوير البرمجيات

الروابط ذات الصلة