تقرير الذكاء الاصطناعي الأسبوعي: أساليب الاستدلال التكراري، وهندسة فك التشفير خفيفة الوزن، وهندسة الشبكات العصبية التلافيفية العميقة، والمزيد - نظرة على أحدث التطورات في مجالات متعددة

الهدف طويل المدى للوكلاء المعتمدين على اللغة هو التعلم والتحسين المستمر من خلال خبراتهم، متجاوزين في نهاية المطاف الأداء البشري في المهام الواقعية المعقدة. ومع ذلك، لا يزال تدريب الوكلاء باستخدام التعلم المعزز المستند فقط إلى البيانات التجريبية أمرًا صعبًا في العديد من البيئات، حيث لا توجد إشارات مكافأة قابلة للتحقق (مثل تفاعلات صفحات الويب) أو حيث تكون إعادة تشغيل المسار طويل المدى غير فعالة (مثل جولات متعددة من استخدام الأدوات). ونتيجة لذلك، لا يزال معظم الوكلاء الحاليين يعتمدون على الضبط الدقيق المُشرف عليه باستخدام بيانات الخبراء، وهو نهج يصعب تطبيقه على نطاق واسع ويعاني من ضعف التعميم.
للتغلب على هذا القيد، اقترح مختبر الذكاء الفائق، ومؤسسة ميتا فير، وجامعة ولاية أوهايو، بشكل مشترك، نموذجًا توفيقيًا يُسمى "التجربة المبكرة". يستخدم هذا النموذج بيانات التفاعل الناتجة عن سلوك العميل نفسه، مع استخدام الحالات المستقبلية كإشارات إشرافية، بدلًا من الاعتماد على إشارات المكافأة. أرسى هذا النموذج أساسًا متينًا للتعلم التعزيزي اللاحق، جاعلًا منه جسرًا فعالًا بين التعلم بالتقليد والعملاء الذين يعتمدون كليًا على التجربة.
رابط الورقة:https://go.hyper.ai/a8Zkn
أحدث أبحاث الذكاء الاصطناعي:https://go.hyper.ai/hzChC
من أجل السماح لمزيد من المستخدمين بمعرفة أحدث التطورات في مجال الذكاء الاصطناعي في الأوساط الأكاديمية، أطلق الموقع الرسمي لـ HyperAI (hyper.ai) الآن قسم "أحدث الأوراق البحثية"، والذي يقوم بتحديث أوراق البحث المتطورة في مجال الذكاء الاصطناعي كل يوم.إليكم 5 أوراق بحثية شائعة حول الذكاء الاصطناعي نوصي بهادعونا نلقي نظرة سريعة على إنجازات الذكاء الاصطناعي المتطورة لهذا الأسبوع⬇️
توصيات الورقة البحثية لهذا الأسبوع
1. الأقل هو الأكثر: التفكير التكراري مع الشبكات الصغيرة
تقترح هذه الورقة البحثية النموذج التكراري الصغير (TRM)، وهو أسلوب استدلال تكراري أبسط يتفوق بشكل ملحوظ على نموذج HRM في التعميم، معتمدًا فقط على شبكة عصبية صغيرة ثنائية الطبقات. باستخدام 7 ملايين معلمة فقط، يحقق TRM دقة اختبار تبلغ 451 TP3T في مهمة ARC-AGI-1 و81 TP3T في مهمة ARC-AGI-2، متجاوزًا بذلك أداء معظم نماذج اللغات الكبيرة (مثل Deepseek R1 وo3-mini)، مع استخدام أقل من 0.011 TP3T من معلمات هذه النماذج.
رابط الورقة:https://go.hyper.ai/bUZ6M

2. PromptCoT 2.0: توسيع نطاق التوليف الفوري لمنطق ماجستير القانون
تقدم هذه الورقة البحثية إطار عمل PromptCoT 2.0، وهو إطار عمل قابل للتطوير يستبدل القواعد الإرشادية المصممة يدويًا بحلقة تكرارية لتعظيم التوقعات (EM) لتوجيه بناء المطالبات من خلال تحسين عملية الاستدلال تكراريًا. يُنتج هذا النهج أسئلةً أكثر تحديًا وتنوعًا من مجموعات الأسئلة السابقة.
رابط الورقة:https://go.hyper.ai/jKAmy

3. التطلع إلى التعلم: البوابات الديناميكية لكل رمز لنمذجة الرؤية واللغة منخفضة الموارد
يقترح هذا البحث بنية فك تشفير خفيفة الوزن بثلاثة تصميمات رئيسية: (1) آلية بوابة ديناميكية على مستوى الرمز لتحقيق اندماج تكيفي بين اللغة والإشارات البصرية؛ (2) آلية تعديل الميزة وانتباه القناة لتعظيم كفاءة استخدام المعلومات البصرية المحدودة؛ و(3) هدف تعليم التباين المساعد لتحسين قدرات تحديد المواقع البصرية.
رابط الورقة:https://go.hyper.ai/D178P

4. تعلم العميل من خلال الخبرة المبكرة
لا تزال معظم الوكلاء الأذكياء الحاليين يعتمدون على الضبط الدقيق المُشرف عليه باستخدام بيانات الخبراء، إلا أن هذا النهج يصعب تطبيقه على نطاق واسع ويعاني من ضعف في التعميم. ينبع هذا القيد من طبيعة العروض التوضيحية للخبراء: فهي لا تغطي سوى عدد محدود من السيناريوهات، مما يؤدي إلى تنوع غير كافٍ في البيئات المُعرضة للوكيل. لتجاوز هذا القيد، تقترح هذه الورقة نموذجًا توفيقيًا: "التجربة المبكرة"، والذي يتضمن استخدام بيانات التفاعل التي يُولّدها الوكيل من خلال سلوكه الخاص، مع استخدام الحالات المستقبلية كإشارات إشرافية، دون الاعتماد على إشارات المكافأة.
رابط الورقة:https://go.hyper.ai/a8Zkn

5. Xception: التعلم العميق باستخدام التفافات منفصلة بعمق
تقترح هذه الورقة البحثية بنية Xception، وهي بنية جديدة للشبكات العصبية التلافيفية العميقة مستوحاة من Inception، حيث استُبدلت وحدة Inception بتلافيفات منفصلة عميقة. ونظرًا لأن بنية Xception تحتوي على نفس عدد معلمات Inception V3، فإن تحسن الأداء لا يعود إلى زيادة سعة النموذج، بل إلى زيادة كفاءة استخدام معلمات النموذج.
رابط الورقة:https://go.hyper.ai/0BUt5

هذا هو محتوى توصيات البحث لهذا الأسبوع. لمزيد من أبحاث الذكاء الاصطناعي المتطورة، يُرجى زيارة قسم "أحدث الأبحاث" على الموقع الرسمي لـ hyper.ai.
نرحب أيضًا بفرق البحث لتقديم نتائج وأوراق بحثية عالية الجودة إلينا. يمكن للمهتمين إضافة حساب نيوروستار على وي تشات (معرف وي تشات: Hyperai01).
نراكم في الاسبوع القادم!