مجلة AI Paper Weekly | Chai-2 يُجدد كفاءة تصميم الأجسام المضادة، مع زيادة في معدل الإصابة بمقدار 100 ضعف؛ نظرة سريعة على العديد من الأوراق البحثية المدرجة في القائمة المختصرة لجائزة ICML

تتخطى نماذج اللغة البصرية (VLMs) تدريجيًا حدود فهم النصوص التقليدية، وتتجه نحو الإدراك العميق وتحليل المعلومات البصرية المعقدة، لتصبح مكونًا أساسيًا لا غنى عنه في الأنظمة الذكية المعاصرة. ومع القفزة النوعية الكبيرة في ذكاء النماذج، توسعت تطبيقاتها من الإدراك البصري البسيط إلى حل المشكلات العلمية وبناء وكلاء ذكيين مستقلين، مما فرض متطلبات أعلى على قدرات النماذج. ورغم استمرار الأبحاث ذات الصلة، إلا أن هذه الأعمال تقتصر في الغالب على مجالات محددة، ولا يزال هناك نقص في نموذج استدلالي عام متعدد الوسائط.
في هذا الصدد، اقترحت شركة Zhipu AI وجامعة تسينغهوا بشكل مشترك نموذج GLM-4.1V-Thinking. وباعتباره نموذجًا لغويًا بصريًا متعدد الوسائط للفهم والاستدلال، يتميز هذا النموذج بأداء ممتاز في مجموعة متنوعة من المهام، مثل حل مشكلات العلوم والتكنولوجيا والهندسة والرياضيات (STEM)، وفهم الفيديو، والتعرف على المحتوى، والبرمجة، وحل المشكلات المرجعية، والوكلاء المعتمدين على واجهة المستخدم الرسومية (GUI)، وفهم المستندات الطويلة. ومن بين هذه المهام، يُظهر أداءً مماثلاً أو أفضل من النماذج مغلقة المصدر مثل GPT-4o في مهام مثل فهم المستندات الطويلة والاستدلال في العلوم والتكنولوجيا والهندسة والرياضيات (STEM).
رابط الورقة:https://go.hyper.ai/fEPb4
أحدث أبحاث الذكاء الاصطناعي:https://go.hyper.ai/hzChC
من أجل السماح لمزيد من المستخدمين بمعرفة أحدث التطورات في مجال الذكاء الاصطناعي في الأوساط الأكاديمية، أطلق الموقع الرسمي لـ HyperAI (hyper.ai) الآن قسم "أحدث الأوراق البحثية"، والذي يقوم بتحديث أوراق البحث المتطورة في مجال الذكاء الاصطناعي كل يوم.إليكم 5 أوراق بحثية شائعة حول الذكاء الاصطناعي نوصي بها،يحتوي هذا الكتاب على مجموعة بيانات UniMate لمعايير المواد الفوقية الميكانيكية وعنوان تنزيلها. كما لخصنا لكم الخريطة الذهنية لهيكل الورقة. لنلقِ نظرة سريعة على إنجازات هذا الأسبوع في مجال الذكاء الاصطناعي.⬇️
توصيات الورقة البحثية لهذا الأسبوع
1 GLM-4.1V-التفكير: نحو تفكير متعدد الوسائط متعدد الاستخدامات مع التعلم التعزيزي القابل للتطوير
تُقدّم هذه الورقة البحثية نموذج GLM-4.1V-Thinking، وهو نموذج لغوي بصري مُصمّم لتعزيز الفهم والاستدلال متعدد الوسائط. وقد أتاح الفريق نموذج GLM-4.1V-9B-Thinking مفتوح المصدر، والذي يُحقق أداءً مُتطوّرًا مقارنةً بالنماذج ذات الحجم المُماثل.
بعد تقييم شامل على 28 معيارًا عامًا، تفوق النموذج على Qwen2.5-VL-7B في جميع المهام تقريبًا، وأظهر أداءً مماثلًا أو أفضل من Qwen2.5-VL-72B الأكبر حجمًا بكثير في 18 معيارًا. والجدير بالذكر أن النموذج يُظهر أيضًا أداءً مماثلًا أو أفضل من النماذج مغلقة المصدر مثل GPT-4o في المهام الصعبة مثل فهم المستندات الطويلة والتفكير في العلوم والتكنولوجيا والهندسة والرياضيات، مما يُبرز قدراته القوية.
رابط الورقة:https://go.hyper.ai/fEPb4


2 تصميم الأجسام المضادة بدون طلقة في صفيحة مكونة من 24 بئرًا
تُقدّم هذه الورقة البحثية نموذج Chai-2 التوليدي متعدد الأنماط، والذي يُحقق معدل نجاح يبلغ 16% في تصميم الأجسام المضادة المُبتكر بالكامل، وهو تحسّنٌ يتجاوز 100 ضعف مقارنةً بالطرق الحسابية السابقة. بالإضافة إلى تصميم الأجسام المضادة، يُحقق Chai-2 معدل نجاح في المختبرات الرطبة يبلغ 68% في تصميم البروتينات الصغيرة، وغالبًا ما يُولّد روابط بيكومولار. يسمح معدل النجاح العالي لـ Chai-2 بالتحقق التجريبي السريع من صحة الأجسام المضادة الجديدة وتوصيفها في أقل من أسبوعين، مما يُمهد الطريق لعصر جديد من الهندسة الجزيئية السريعة والدقيقة على المستوى الذري.
رابط الورقة:https://go.hyper.ai/rRRML


3 UniMate: نموذج موحد لتوليد المواد الميكانيكية الفائقة، والتنبؤ بالخصائص، وتأكيد الحالة
في تصميم المواد الخارقة الميكانيكية، عادةً ما تُستخدم ثلاثة أوضاع رئيسية، وهي: البنية الطوبولوجية ثلاثية الأبعاد، وحالة الكثافة، والخصائص الميكانيكية. ومع ذلك، لا تأخذ معظم الدراسات الحالية في الاعتبار سوى وضعين. تقترح هذه الورقة نموذجًا موحدًا يُسمى UniMate، يتكون من وحدة محاذاة نمطية ووحدة توليد انتشار تعاوني. تُظهر النتائج التجريبية أن UniMate يتفوق على النماذج الأساسية الأخرى بمقدار 80.2%، و5.1%، و50.2% في مهام توليد الطوبولوجيا، ومهام التنبؤ بالأداء، ومهام تأكيد الحالة، على التوالي.
رابط الورقة:https://go.hyper.ai/KNcmr
مجموعة بيانات معيارية للمواد الميكانيكية الفائقة من UniMate:https://go.hyper.ai/p4535


4 SAM4D: تقسيم أي شيء في تدفقات الكاميرا والليدار
تُقدّم هذه الورقة نموذجًا جديدًا يُسمى SAM4D، يهدف إلى تحقيق مهام تجزئة متعددة الوسائط وحساسة للزمان والمكان بين تدفقات الكاميرا والرادار. يُوازِي هذا النموذج خصائص الكاميرا والرادار من خلال ترميز موحد متعدد الوسائط للموضع، ويستخدم آلية ذاكرة متعددة الوسائط مُراعية للحركة لتعزيز الاتساق الزمني، مما يضمن تجزئة قوية في البيئات الديناميكية. ولتجنب اختناق التعليقات التوضيحية، تقترح هذه الورقة أيضًا محرك بيانات آليًا يُولّد تلقائيًا تسميات شبهية عالية الجودة استنادًا إلى أقنعة إطارات الفيديو، وإعادة البناء رباعية الأبعاد، ودمج أقنعة متعددة الوسائط، مما يُحسّن كفاءة التعليقات التوضيحية بشكل فعال مع الحفاظ على الدقة الدلالية المُستمدة من VFM.
رابط الورقة:https://go.hyper.ai/QtQEx


5 WebSailor: استكشاف التفكير الخارق لوكيل الويب
تقترح هذه الورقة البحثية طريقةً لتدريب نماذج لغوية كبيرة لتحقيق قدرات استدلالية تتجاوز حدود الإدراك البشري، مع التركيز بشكل خاص على أداء مهام البحث عن المعلومات المعقدة. تعتمد الطريقة على توليد بيانات مهام يصعب تحليلها، والاستفادة من استراتيجيات فعّالة للتعلم التعزيزي، وتطبيق تقنيات البدء البارد المناسبة لتحسين قدرات النموذج. بهذه الطريقة، يتفوق نموذج WebSailor المُطوّر بشكل ملحوظ على نماذج مفتوحة المصدر في معايير البحث عن المعلومات المعقدة باللغتين الإنجليزية والصينية، مثل BrowseComp، ويقترب من مستوى أداء بعض الأنظمة الاحتكارية أو يصل إليه.
رابط الورقة:https://go.hyper.ai/qyvf2


هذا هو محتوى توصيات البحث لهذا الأسبوع. لمزيد من أبحاث الذكاء الاصطناعي المتطورة، يُرجى زيارة قسم "أحدث الأبحاث" على الموقع الرسمي لـ hyper.ai.
نرحب أيضًا بفرق البحث لتقديم نتائج وأوراق بحثية عالية الجودة إلينا. يمكن للمهتمين إضافة حساب نيوروستار على وي تشات (معرف وي تشات: Hyperai01).
نراكم في الاسبوع القادم!