HyperAI

في 29 سبتمبر 2025 أطلقت شركة أنثروبيك نموذج كلاود سونيت 45 مُعلنةً أنه أفضل نموذج ترميز في العالم وخطوة كبيرة في تطوير الذكاء الاصطناعي التطبيقي. يأتي النموذج بعد أربعة أشهر فقط من إطلاق سونيت 4 ويُعدّ جزءًا من سباق التطور السريع في مجال الذكاء الاصطناعي التوليدي. حظي النموذج بتحسن ملحوظ في اختبار SWE-Bench Verified الذي يقيس الأداء الهندسي الفعلي حيث حقق 772% من الدرجات وعند استخدام الحوسبة المتوازية ارتفع إلى 82% متفوقًا على GPT-5 كودكس الذي حصل على 745% وGemini 25 برو بـ672%. كما أظهر تقدمًا كبيرًا في اختبار OSWorld الذي يقيس القدرة على التفاعل مع بيئة سطح المكتب حيث بلغت النتيجة 614% مقارنة بـ422% لسونيت 4. وفي اختبار Terminal-Bench الخاص بالواجهة السطرية حقق 50% متفوقًا على GPT-5 الذي بلغ 438%. الأهم من الأرقام هو القدرة على العمل بشكل مستقل لمدة تصل إلى 30 ساعة مما يزيد من قدرته على تنفيذ مهام معقدة متعددة الخطوات. في تجارب داخلية نجح النموذج في بناء تطبيق تواصل مشابه لـSlack أو Teams يشمل بناء قاعدة بيانات وشراء نطاق وتشغيل مراجعة أمنية وكتابة نحو 11 ألف سطر كود. كما أجرى المدون سيمون ويليسون تجربة ناجحة في إعادة بناء مشروعه الخاص بتحويل هيكل المحادثة من خطي إلى شجري مع إجراء تنقلات قاعدة بيانات وكتابة أدوات وتشغيل 22 اختبارًا بنجاح. لدعم هذه القدرات أطلقت أنثروبيك أدوات متطورة للتطوير منها SDK لـ Claude Agent الذي يوفر أدوات دقيقة لإنشاء وكالات ذكية قادرة على إدارة الذاكرة الطويلة والتنسيق بين المهام والتعامل مع التفويض. كما تم ترقية أدوات Claude Code إلى الإصدار 20 مع ميزة "النقاط المرجعية" التي تسمح بالعودة إلى حالات سابقة عند حدوث خطأ. تم أيضًا إطلاق إضافة مباشرة لـVS Code وتحسين تدفقات الطرفية لتحسين تجربة المطورين. من الناحية التجارية حقق منتج Claude Code أكثر من 500 مليون دولار من الإيرادات السنوية مع نمو استخدامه أكثر من 10 أضعاف خلال ثلاثة أشهر. يُعد هذا النمو دليلًا على تفوق أنثروبيك في مجال الترميز الآلي الذي يوفر وفورات كبيرة في الإنتاجية والتكلفة. كما أشارت الشركة إلى تفوق النموذج في مجالات أمن السيبراني والخدمات المالية في مهام البحث والنمذجة والتوقعات. على الرغم من التقدم الكبير في الأمان والانسجام أظهرت تجارب أولية أن النموذج يمكن اختراقه بسهولة من قبل خبراء التحفيز، مما يبرز التحدي المستمر في التحكم في النماذج التنبؤية. ورغم تقليل معدلات التصنيف الخاطئ بنسبة 90% لا يزال هناك احتمال لانقطاع المحادثات بسبب احتمالات خاطئة. في خطة التسعير حافظت أنثروبيك على نفس سعر سونيت 4 حيث 3 دولارات لكل مليون توكين دخول و15 لكل مليون توكين خرج مقابل 15 و75 دولارًا للنموذج الرائد أوبيس. يُعد هذا السعر متوسطًا بين GPT-5 ونماذج أخرى. بتحولها من نموذج خدمة إلى منصة خدمة تُقدّم أدوات كاملة أنثروبيك تبني نظامًا بيئيًا متكاملًا يشمل المطورين والشركات. هذا التحول يُظهر رؤية استراتيجية واضحة لتحويل القدرات الفنية إلى أدوات عملية وقابلة للاستخدام. في ظل توقعات بإطلاق Gemini 3 فإن المنافسة ستزداد حدة لكن قدرة أنثروبيك على تحويل النموذج إلى أداة إنتاجية موثوقة قد تكون مفتاح تفوقها في المدى الطويل.

الروابط ذات الصلة

الروابط ذات الصلة

الروابط ذات الصلة

ما وراء الواقع المرئي: نظام التقييم الجديد في تسينغهوا وورلد أرينا يكشف عن فجوة القدرات في نماذج العالم المجسد

ما وراء الواقع المرئي: نظام التقييم الجديد في تسينغهوا وورلد أرينا يكشف عن فجوة القدرات في نماذج العالم المجسد

Command Palette

أنثروبيك تطلق كلاود سونيت 4.5 بقدرات برمجة مستمرة لـ30 ساعة

الروابط ذات الصلة

Command Palette

أنثروبيك تطلق كلاود سونيت 4.5 بقدرات برمجة مستمرة لـ30 ساعة

الروابط ذات الصلة

Command Palette

أنثروبيك تطلق كلاود سونيت 4.5 بقدرات برمجة مستمرة لـ30 ساعة

الروابط ذات الصلة

ما وراء الواقع المرئي: نظام التقييم الجديد في تسينغهوا وورلد أرينا يكشف عن فجوة القدرات في نماذج العالم المجسد

ما وراء الواقع المرئي: نظام التقييم الجديد في تسينغهوا وورلد أرينا يكشف عن فجوة القدرات في نماذج العالم المجسد