HyperAIHyperAI

Command Palette

Search for a command to run...

تقرير أسبوعي عن الذكاء الاصطناعي | تصميم بروتين جديد / أول حل مفتوح المصدر للوكيل / HunyuanOCR / نموذج لغة Olmo 3... نظرة عامة بنقرة واحدة

Featured Image

تتمتع نماذج اللغة الكبيرة متعددة الوسائط (MLLMs) بإمكانات كبيرة لتحقيق تفاعل يشبه التفاعل البشري، لكن تطويرها يواجه تحديًا رئيسيًا: عدم وجود إطار تقييم دقيق للسيناريوهات التي تركز على الإنسان والتي يمكنها قياس قدرة النموذج على فهم النوايا البشرية المعقدة وتوفير ردود فعل متعاطفة وواعية بالسياق في نفس الوقت.

بناءً على ذلك، اقترح فريق بحثي من جامعة شيان جياوتونغ، بالتعاون مع مجموعة Ant Group، برنامج HumanSense، وهو معيار شامل مصمم لتقييم قدرات الإدراك والتفاعل المتمركزة حول الإنسان لدى MLLMs، مع التركيز بشكل خاص على الفهم العميق للسياقات متعددة الوسائط الممتدة وصياغة استجابات منطقية. تُظهر النتائج أن MLLMs لديها مجال كبير للتحسين في السيناريوهات المتمركزة حول الإنسان، وخاصةً في المهام الموجهة نحو التفاعلات عالية المستوى. كما صمم الباحثون أسلوبًا متعدد المراحل للتعلم التعزيزي التدريجي، يُشكل HumanSense-Omni-Reasoning، مما يُحسّن الأداء بشكل ملحوظ في مهام الفهم والتفاعل عالية المستوى.

رابط الورقة:https://go.hyper.ai/xYM02

أحدث أبحاث الذكاء الاصطناعي:https://go.hyper.ai/hzChC

من أجل السماح لمزيد من المستخدمين بمعرفة أحدث التطورات في مجال الذكاء الاصطناعي في الأوساط الأكاديمية، أطلق الموقع الرسمي لـ HyperAI (hyper.ai) الآن قسم "أحدث الأوراق البحثية"، والذي يقوم بتحديث أوراق البحث المتطورة في مجال الذكاء الاصطناعي كل يوم.إليكم 5 أوراق بحثية شائعة حول الذكاء الاصطناعي نوصي بهادعونا نلقي نظرة سريعة على إنجازات الذكاء الاصطناعي المتطورة لهذا الأسبوع⬇️

توصيات الورقة البحثية لهذا الأسبوع

1.جام-2

العنوان: JAM-2: التصميم الحاسوبي الكامل للأجسام المضادة الشبيهة بالأدوية مع معدلات نجاح عالية

تُقدّم هذه الورقة البحثية نظام JAM-2، وهو نظام تصميم بروتيني عالمي جديد، يُحقق، لأول مرة، تصميمًا عالي الكفاءة لأجسام مضادة VHH-Fc والأجسام المضادة وحيدة النسيلة كاملة الطول (mAbs) بألفة وتطور يُشبهان الأدوية، مع تحقيق معدلات نجاح تتجاوز العشرة في المئة مع اتساع غير مسبوق في الأهداف والأنماط النمطية. من بين 16 هدفًا غير مُكتشف، نجح JAM-2 في الحصول على جزيئات ربط لجميع الأهداف، بمتوسط معدلات نجاح بلغت 39% (VHH-Fc) و18% (mAb).

رابط الورقة:https://go.hyper.ai/3Mfna

يستخدم JAM-2 تقاربًا يشبه العقاقير لتصميم الأجسام المضادة ضد أهداف لم يسبق رؤيتها من قبل، مع إظهار معدلات ارتباط مكونة من رقمين.

2.أولمو 3

تُقدّم هذه المقالة أولمو 3، وهي عائلة رائدة في مجال نماذج اللغات مفتوحة المصدر بالكامل، بمقياسي معلمات 7 و32 مليار. صُممت نماذج أولمو 3 لتمكين الاستدلال في سياقات طويلة، واستدعاءات الدوال، والبرمجة، واتباع التعليمات، والحوار العام، واسترجاع المعرفة. يتضمن هذا الإصدار شرحًا شاملًا لسير عمل النموذج، يغطي دورة حياة عائلة النماذج بالكامل، من مرحلة البناء إلى النشر، ويشمل جميع مراحل التدريب، ونقاط التفتيش، ونقاط البيانات، والتبعيات.

رابط الورقة:https://go.hyper.ai/HgvWV

مخطط سير العمل النموذجي

3.لومين

العنوان: Lumine: وصفة مفتوحة لبناء عملاء عامين في عوالم مفتوحة ثلاثية الأبعاد

تقترح هذه الورقة البحثية Lumine، أول نظام مفتوح المصدر لتطوير وكلاء ذكيين متعددي الأغراض، قادر على تنفيذ مهام معقدة لساعات في الوقت الفعلي ضمن بيئات مفتوحة ثلاثية الأبعاد معقدة. يعتمد النموذج على نموذج تفاعلي شبيه بالتفاعل البشري، يجمع بين الإدراك والاستدلال والفعل بشكل متكامل من خلال نموذج بصري-لغوي. يعالج النموذج مُدخلات البكسل الخام بمعدل 5 إطارات في الثانية، ويُولّد حركات دقيقة للوحة المفاتيح والفأرة بمعدل 30 إطارًا في الثانية، ويستدعي وحدة الاستدلال ديناميكيًا عند الضرورة فقط.

رابط الورقة:https://go.hyper.ai/6qg4A

نظرة عامة على النموذج

4.هيومان سينس

العنوان: HumanSense: من الإدراك المتعدد الوسائط إلى الاستجابات التعاطفية الواعية للسياق من خلال التفكير متعدد الوسائط

تقترح هذه الورقة البحثية HumanSense، وهو إطار عمل شامل للمقارنة المعيارية مُصمم لتقييم قدرات MLLMs في الإدراك والتفاعل المُركز على الإنسان، مع التركيز بشكل خاص على الفهم العميق للسياقات متعددة الوسائط طويلة المدى وتوليد استجابات منطقية. تُظهر نتائج تقييمنا أن MLLMs الرائدة حاليًا لا تزال لديها مجال كبير للتحسين في مهام التفاعل عالية المستوى. علاوة على ذلك، تُصمم هذه الورقة نهجًا متعدد المراحل ومتدرج الوسائط للتعلم التعزيزي لبناء نموذج HumanSense-Omni-Reasoning، مما يُحسّن أداء النموذج بشكل كبير في مهام الفهم والتفاعل عالية المستوى.

رابط الورقة:https://go.hyper.ai/xYM02

تم تصميم HumanSense وفقًا لهيكل هرمي.

5.تقرير فني HunyuanOCR

تقترح هذه الورقة البحثية HunyuanOCR، وهو نموذج لغة بصرية (VLM) تجاري، مفتوح المصدر، وخفيف الوزن (مليار معلمة) لمهام التعرف الضوئي على الحروف (OCR). تتكون بنية النموذج من محول بصري أصلي (ViT) ونموذج لغة كبير خفيف الوزن (LLM) متصلين عبر محول MLP. يُظهر HunyuanOCR أداءً فائقًا، متجاوزًا واجهات برمجة التطبيقات التجارية الحالية، وسير عمل المعالجة التقليدية، والنماذج ذات عدد المعلمات الأكبر (مثل Qwen3-VL-4B).

رابط الورقة:https://go.hyper.ai/KxstF

مخطط معماري للنموذج

هذا هو محتوى توصيات البحث لهذا الأسبوع. لمزيد من أبحاث الذكاء الاصطناعي المتطورة، يُرجى زيارة قسم "أحدث الأبحاث" على الموقع الرسمي لـ hyper.ai.

نرحب أيضًا بفرق البحث لتقديم نتائج وأوراق بحثية عالية الجودة إلينا. يمكن للمهتمين إضافة حساب نيوروستار على وي تشات (معرف وي تشات: Hyperai01).

نراكم في الاسبوع القادم!