HyperAIHyperAI

تقرير أسبوعي عن الذكاء الاصطناعي: نظرة سريعة على وكلاء الذاكرة متعددة الوسائط، ونماذج Visual Basic، ونماذج الاستدلال، والمزيد

特色图像

في تطوير الوكلاء الأذكياء متعددي الوسائط، كانت كيفية تخزين الذاكرة طويلة المدى واستخدامها بكفاءة مثل البشر دائمًا تحديًا رئيسيًا.

يقدم إطار عمل M3-Agent حلاً مبتكرًا لهذه المشكلة: فهو يستقبل ويعالج المدخلات البصرية والسمعية آنيًا، محولًا هذه المعلومات إلى رسم بياني للذاكرة طويلة المدى متعدد الوسائط، متمركز حول الكيان. كما يتضمن آلية هرمية للذاكرة العرضية والدلالية. وبالمقارنة مع المناهج التقليدية، يُظهر هذا الإطار خصائص أقرب إلى الذكاء البشري من حيث حفظ المعلومات على المدى الطويل، والتفكير متعدد الوسائط، واتساق الذاكرة.

رابط الورقة:https://go.hyper.ai/lGKm9

أحدث أبحاث الذكاء الاصطناعي:https://hyper.ai/papers

من أجل السماح لمزيد من المستخدمين بمعرفة أحدث التطورات في مجال الذكاء الاصطناعي في الأوساط الأكاديمية، أطلق الموقع الرسمي لـ HyperAI (hyper.ai) الآن قسم "أحدث الأوراق البحثية"، والذي يقوم بتحديث أوراق البحث المتطورة في مجال الذكاء الاصطناعي كل يوم.إليكم 5 أوراق بحثية شائعة حول الذكاء الاصطناعي نوصي بهافي الوقت نفسه، قمنا أيضًا بتلخيص الخريطة الذهنية لهيكل الورقة للجميع. لنلقِ نظرة سريعة على إنجازات الذكاء الاصطناعي الرائدة لهذا الأسبوع⬇️

توصيات الورقة البحثية لهذا الأسبوع

1. الرؤية والاستماع والتذكر والاستدلال: وكيل متعدد الوسائط ذو ذاكرة طويلة المدى

تُقدّم هذه الورقة البحثية M3-Agent، وهو إطار عمل جديد متعدد الوسائط للوكلاء بذاكرة طويلة المدى. يُعالج M3-Agent المُدخلات البصرية والسمعية الآنية، ويستخدم هذه المعلومات لبناء ذاكرته طويلة المدى وتحديثها. بالإضافة إلى الذاكرة العرضية، يُطوّر أيضًا ذاكرة دلالية، مُراكمًا المعرفة العالمية حول بيئته. تُظهر النتائج التجريبية أن M3-Agent، المُدرّب باستخدام التعلم المُعزّز، يتفوّق على أقوى خط أساس باستخدام مزيج من إشارات نموذجي Gemini-1.5-pro وGPT-4o.

رابط الورقة:https://go.hyper.ai/lGKm9

مجموعة بيانات معيارية للإجابة على أسئلة الفيديو الطويلة M3-Bench:https://go.hyper.ai/FPR7q

مخطط معماري للنموذج
خريطة ذهنية ورقية

2.Medical Graph RAG: نحو نموذج لغوي طبي كبير آمن عبر توليد معزز لاسترجاع الرسم البياني

تقترح هذه الورقة البحثية إطار عمل مبتكرًا لتوليد البيانات المعززة بالاسترجاع (RAG) قائم على الرسوم البيانية في المجال الطبي، يُسمى MedGraphRAG. يهدف هذا الإطار إلى تعزيز قدرة نماذج اللغة واسعة النطاق على توليد إجابات طبية قائمة على الأدلة، مع تعزيز أمان وموثوقية معالجة البيانات الطبية الخاصة. يقدم فريق البحث تقنيتين مبتكرتين في الورقة البحثية: بناء هيكل الرسم البياني الثلاثي وآلية الاسترجاع U.

رابط الورقة:https://go.hyper.ai/FIuKc

مخطط معماري للنموذج
خريطة ذهنية ورقية

3.VisCodex: توليد كود متعدد الوسائط موحد عبر دمج نماذج الرؤية والترميز

تُقدّم هذه الورقة البحثية إطار عمل مبتكرًا، VisCodex، يُحسّن قدرات توليد الشيفرة البرمجية لنماذج اللغات متعددة الوسائط الكبيرة من خلال دمج النماذج المرئية ونماذج الترميز. علاوةً على ذلك، أنشأ فريق البحث مجموعة بيانات واسعة النطاق ومتنوعة، تُسمى مجموعة بيانات الترميز متعدد الوسائط (MCD)، والتي تتضمن شيفرة HTML عالية الجودة، وأزواجًا من المخططات والصور والشفرة، وأسئلة وأجوبة Stack Overflow القائمة على الصور، وأسئلة خوارزمية. تُظهر النتائج التجريبية أن VisCodex يُحقق أداءً جيدًا عبر تقييمات متعددة، متجاوزًا بذلك نماذج MLLM مفتوحة المصدر، ومقتربًا من أداء نموذج GPT-4o الرائد على مستوى المؤسسات.

رابط الورقة:https://go.hyper.ai/JJtbR

مخطط معماري للنموذج
خريطة ذهنية ورقية

4.دينو في 3

تقترح هذه الورقة نموذجًا أساسيًا بصريًا متعدد الاستخدامات ذاتي الإشراف، DINOv3، مصممًا لتوليد خصائص كثيفة عالية الجودة. يحقق هذا النموذج أداءً ممتازًا في مجموعة متنوعة من المهام البصرية، متفوقًا بشكل ملحوظ على النماذج الأساسية السابقة ذاتية الإشراف وضعيفة الإشراف. كما أصدر فريق البحث مجموعة نماذج DINOv3، بهدف توفير حلول قابلة للتطوير لمختلف قيود الموارد وسيناريوهات النشر.

رابط الورقة:https://go.hyper.ai/lUNDj

مخطط معماري للنموذج
خريطة ذهنية ورقية

5.اللاما-نيموترون: نماذج استدلال فعّالة

تُقدّم هذه المقالة عائلة نماذج Llama-Nemotron، وهي عائلة مفتوحة من نماذج الاستدلال غير المتجانسة ذات قدرات استدلال وكفاءة فائقة، ومتاحة بموجب ترخيص مفتوح للاستخدام المؤسسي. تتضمن العائلة ثلاثة أحجام: Nano (8B)، وSuper (49B)، وUltra (253B). ينافس أداؤها نماذج الاستدلال الحديثة، مع توفير إنتاجية استدلال وكفاءة ذاكرة فائقة.

رابط الورقة:https://go.hyper.ai/3INVh

مخطط معماري للنموذج
خريطة ذهنية ورقية

هذا هو محتوى توصيات البحث لهذا الأسبوع. لمزيد من أبحاث الذكاء الاصطناعي المتطورة، يُرجى زيارة قسم "أحدث الأبحاث" على الموقع الرسمي لـ hyper.ai.

نرحب أيضًا بفرق البحث لتقديم نتائج وأوراق بحثية عالية الجودة إلينا. يمكن للمهتمين إضافة حساب نيوروستار على وي تشات (معرف وي تشات: Hyperai01).

نراكم في الاسبوع القادم!

تقرير أسبوعي عن الذكاء الاصطناعي: نظرة سريعة على وكلاء الذاكرة متعددة الوسائط، ونماذج Visual Basic، ونماذج الاستدلال، والمزيد | الأخبار | HyperAI