HyperAI

تقرير أسبوعي عن الذكاء الاصطناعي: أحدث الأبحاث من علي بابا، وجامعة شيامن، وجامعة تشجيانغ، وغيرها، تغطي خوارزميات تحسين التعلم التعزيزي، ووكلاء واجهة المستخدم الرسومية، وضغط السياق متعدد الوسائط، والمزيد

特色图像

مع استمرار توسع نماذج اللغات واسعة النطاق، يُصبح تدريب التعلم التعزيزي الفعّال والمستقر تحديًا رئيسيًا. ولمعالجة هذا، اقترح فريق Qwen التابع لمجموعة علي بابا خوارزمية جديدة للتعلم التعزيزي، تُعرف باسم تحسين سياسة تسلسل المجموعات (GSPO).

بخلاف الطرق التقليدية التي تعتمد على نسب الأهمية على مستوى الرمز، يُحدد GSPO نسب الأهمية بناءً على احتمالات التسلسل، ويُجري عمليات الاختصار والمكافآت والتحسين على مستوى التسلسل، مما يُحسّن بشكل كبير استقرار التدريب وكفاءته. يُحقق GSPO أداءً استثنائيًا ضمن بنية مزيج الخبراء، مما يُبسط تصميم البنية التحتية للتعلم المُعزز، ويُحسّن بشكل كبير أداء أحدث طراز Qwen3.

رابط الورقة:https://go.hyper.ai/FOrdj

أحدث أبحاث الذكاء الاصطناعي:https://go.hyper.ai/hzChC

من أجل السماح لمزيد من المستخدمين بمعرفة أحدث التطورات في مجال الذكاء الاصطناعي في الأوساط الأكاديمية، أطلق الموقع الرسمي لـ HyperAI (hyper.ai) الآن قسم "أحدث الأوراق البحثية"، والذي يقوم بتحديث أوراق البحث المتطورة في مجال الذكاء الاصطناعي كل يوم.إليكم 5 أوراق بحثية شائعة حول الذكاء الاصطناعي نوصي بهادعونا نلقي نظرة سريعة على إنجازات الذكاء الاصطناعي المتطورة لهذا الأسبوع⬇️

توصيات الورقة البحثية لهذا الأسبوع

1 تحسين سياسة تسلسل المجموعة

تُقدّم هذه الورقة البحثية خوارزمية تحسين سياسة تسلسل المجموعات (GSPO)، وهي خوارزمية تعلّم تعزيزي مستقرة وفعّالة وعالية الأداء لتدريب نماذج اللغات الكبيرة. بخلاف الخوارزميات السابقة التي تستخدم نسب أهمية الرموز، تُعرّف GSPO نسب الأهمية بناءً على احتمالية التسلسل، وتُجري عمليات تقليم ومكافآت وتحسين على مستوى التسلسل.

رابط الورقة:https://go.hyper.ai/FOrdj

الرسم البياني للبيانات التجريبية

2 UI-AGILE: تطوير وكلاء واجهة المستخدم الرسومية من خلال التعلم التعزيزي الفعال والتأريض الدقيق لوقت الاستدلال

لا تزال أساليب تدريب واستنتاج وكلاء واجهة المستخدم الرسومية الحالية تواجه تحديات، مثل صعوبات تصميم الاستدلال، وآليات المكافأة غير الفعالة، وتداخل الضوضاء البصرية. تقترح هذه الورقة البحثية طريقة جديدة - محاذاة التحليل الانتقائي - تُحسّن دقة المحاذاة بشكل ملحوظ على الواجهات عالية الدقة من خلال تقسيم الصورة إلى أجزاء أصغر وأسهل إدارة. تُظهر النتائج التجريبية أن UI-AGILE يحقق أداءً متطورًا في مهمتين معياريتين: ScreenSpot-Pro وScreenSpot-v2.

رابط الورقة:https://go.hyper.ai/SRpdE

مخطط معماري للنموذج

3 عندما تتحدث الرموز كثيرًا:  دراسة استقصائية حول ضغط الرموز متعدد الوسائط في سياق طويل عبر الصور ومقاطع الفيديو والمقاطع الصوتية

تقدم هذه الورقة أول مراجعة منهجية وملخص لمجال البحث سريع التطور، وهو مجال ضغط الرموز متعدد الوسائط طويل السياق. ونظرًا للخصائص الفريدة والتكرارية لمختلف الوسائط، صنّف الباحثون الطرق الحالية حسب نوع البيانات التي تتناولها بشكل أساسي، مما يتيح الوصول السريع إلى الطرق القابلة للتطبيق في مجالات بحثية محددة: الضغط المرتكز على الصورة، والضغط المرتكز على الفيديو، والضغط المرتكز على الصوت.

رابط الورقة:https://go.hyper.ai/nOYw4

مخطط معماري للنموذج

4 SciToolAgent: وكيل علمي مدفوع برسوم بيانية معرفية لتكامل الأدوات المتعددة

تقدم هذه الورقة البحثية برنامج SciToolAgent، وهو برنامج مدعوم من برنامج ماجستير القانون (LLM)، يُؤتمت تشغيل مئات أدوات البحث العلمي في مجالات الأحياء والكيمياء وعلوم المواد. في جوهره، يُعد SciToolAgent رسمًا بيانيًا للمعرفة باستخدام الأدوات العلمية، يعتمد على آلية توليد معزز بالاسترجاع (RAG) قائمة على الرسوم البيانية، لتمكين اختيار الأدوات وتشغيلها بذكاء. كما يدمج النظام وحدة فحص سلامة شاملة لضمان الاستخدام المسؤول والأخلاقي للأدوات.

رابط الورقة:https://go.hyper.ai/IOiRk

مخطط معماري للنموذج

5 SmallThinker: مجموعة من المنتجات الفعالة  نماذج اللغة الكبيرة بشكل أصلي  مدرب على النشر المحلي

تقدم هذه الورقة البحثية SmallThinker، وهي مجموعة من وحدات إدارة قواعد البيانات (LMs) مصممة خصيصًا للأجهزة المحلية (بدلاً من ضغطها من نماذج السحابة). صُممت هذه الوحدات خصيصًا لمعالجة القيود الفريدة للأجهزة المحلية: ضعف قدرة الحوسبة، وقلة الذاكرة، وبطء التخزين. أُعيد تصميم SmallThinker هندسيًا للعمل بكفاءة في بيئات محدودة. يتميز في جوهره ببنية مبتكرة "موجهة نحو النشر" تترجم قيود النظام إلى مبادئ تصميم.

رابط الورقة:https://go.hyper.ai/tSwpG

مخطط معماري للنموذج

هذا هو محتوى توصيات البحث لهذا الأسبوع. لمزيد من أبحاث الذكاء الاصطناعي المتطورة، يُرجى زيارة قسم "أحدث الأبحاث" على الموقع الرسمي لـ hyper.ai.

نرحب أيضًا بفرق البحث لتقديم نتائج وأوراق بحثية عالية الجودة إلينا. يمكن للمهتمين إضافة حساب نيوروستار على وي تشات (معرف وي تشات: Hyperai01).

نراكم في الاسبوع القادم!