Command Palette
Search for a command to run...
تقرير أسبوعي عن الأبحاث | تقنية DeepMind D4RT لإعادة البناء الديناميكي الموحد رباعي الأبعاد، سرعة الاستدلال ترتفع 300 ضعف؛ جامعة كولومبيا وآخرون يقترحون نظرية الذكاء الاصطناعي الذكي لإعادة صياغة أهداف تطور الذكاء الاصطناعي، مما يُبدد وهم عالمية الذكاء الاصطناعي العام... نظرة سريعة على أحدث أبحاث الذكاء الاصطناعي لهذا الأسبوع

لطالما شكّل فهم وإعادة بناء الأشكال الهندسية المعقدة ومسارات الحركة في مقاطع الفيديو الديناميكية تحديًا كبيرًا في مجال رؤية الحاسوب. غالبًا ما تعتمد الحلول التقليدية على تجميع نماذج مجزأة خاصة بكل مهمة، أو على الانغماس في عمليات تحسين متكررة مكلفة حسابيًا إطارًا بإطار. ولمعالجة هذه المشكلة، قام فريق بحثي من جوجل ديب مايند، بالتعاون مع جامعة أكسفورد وكلية لندن الجامعية (UCL)، بتغيير جذري في منهجية فك التشفير الجامدة على مستوى الإطار.نقترح إطار عمل موحد بسيط ولكنه قوي للتغذية الأمامية، D4RT، والذي يمكنه استنتاج العمق والاتساق المكاني الزمني ومعلمات الكاميرا الكاملة بشكل مشترك باستخدام مدخل فيديو واحد فقط.
يكمن الابتكار الأساسي لهذه البنية في تقديم آلية "استعلام" عالية المرونة. فبعد ترميز الفيديو إلى تمثيل كامن للمشهد الكلي، يسمح النموذج لوحدة فك ترميز خفيفة الوزن باستكشاف الحالة ثلاثية الأبعاد لأي بكسل في المكان والزمان بشكل مستقل ومتوازٍ، متجنبًا بذلك العبء الكبير لإدارة وحدات فك ترميز متعددة ومعقدة. وتُظهر النتائج التجريبية أن...لا يقتصر تصميم D4RT القابل للتوسع بدرجة عالية على تحقيق أرقام قياسية جديدة في العديد من المهام، بما في ذلك إعادة البناء الديناميكي رباعي الأبعاد والتتبع، بل يحقق أيضًا، بفضل بنيته القابلة للتوازي بدرجة عالية، تحسينات هائلة في كفاءة التتبع والاستدلال من 18 إلى 300 مرة مقارنة بأحدث الطرق الحالية.وهذا يضع معياراً جديداً للجيل القادم من الإدراك البصري رباعي الأبعاد من البداية إلى النهاية، والذي يجمع بين قابلية التوسع العالية والأناقة النظرية.

رابط الورقة:https://go.hyper.ai/kGrFN
أحدث أبحاث الذكاء الاصطناعي:https://go.hyper.ai/hzChC
لمساعدة المزيد من المستخدمين على فهم أحدث التطورات في مجال الذكاء الاصطناعي في الأوساط الأكاديمية،يحتوي موقع HyperAI الإلكتروني (hyper.ai) الآن على قسم "أحدث الأوراق البحثية"، والذي يتم تحديثه بانتظام بأحدث أوراق البحث في مجال الذكاء الاصطناعي.إليكم ثمانية أبحاث شائعة في مجال الذكاء الاصطناعي نوصي بها. دعونا نلقي نظرة سريعة على أحدث إنجازات الذكاء الاصطناعي لهذا الأسبوع ⬇️
توصيات الورقة البحثية لهذا الأسبوع
1.D4RT
عنوان الورقة:
إعادة بناء المشاهد الديناميكية بكفاءة، واحدة تلو الأخرى.
اقترحت جوجل ديب مايند نموذجًا موحدًا للتغذية الأمامية، يُدعى D4RT، لإعادة بناء وتتبع رباعي الأبعاد بكفاءة عالية في المشاهد الديناميكية. على عكس مخططات فك التشفير الكثيفة التقليدية التي تعتمد على الإطارات، يقوم D4RT أولًا بتشفير فيديو واحد إلى تمثيل شامل للمشهد، ثم، من خلال آلية استعلام مستقلة، يجمع الإحداثيات المكانية والزمانية مع معلومات RGB المحلية للحصول على الموضع ثلاثي الأبعاد لأي نقطة عند الحاجة. يحقق هذا التصميم فصلًا مكانيًا وزمانيًا، مما يقلل بشكل كبير من الحمل الحسابي مع الحفاظ على التفاصيل الهندسية عالية التردد. تُظهر التجارب أن D4RT قادر على إخراج خرائط العمق، وسحب النقاط، ومعلمات الكاميرا، ونتائج تتبع البكسل الكامل بشكل موحد، ويضع معايير رائدة في العديد من المجالات، مع زيادة سرعات الاستدلال من عشرة إلى مئة ضعف أو أكثر، مما يوفر نموذجًا جديدًا للإدراك رباعي الأبعاد بكفاءة عالية.
ورقة وتفسير مفصل:https://go.hyper.ai/kGrFN

2.ساي
عنوان الورقة:
يجب على الذكاء الاصطناعي أن يتبنى التخصص من خلال ذكاء خارق قابل للتكيف
الاعتماد علىجامعة كولومبيا وجامعة نيويوركنشر فريق بحثي دراسة نظرية انتقدت مفهوم الذكاء الاصطناعي العام (AGI) واقترحت إعادة توجيه مسار تطوير الذكاء الاصطناعي نحو الذكاء التكيفي الخارق (SAI). وتشير الدراسة إلى أن الذكاء البشري هو في جوهره نتاج متخصص للغاية للتكيف، وليس عالميًا بالمعنى الحقيقي. لذا، فإن التعريفات الحالية للذكاء الاصطناعي العام، والمستندة إلى الإنسان، تعاني عمومًا من عدم جدوى نظرية أو تناقضات منطقية.
يؤكد الفريق على ضرورة تبني الذكاء الاصطناعي للتخصص، وتحويل جوهر التقييم إلى "سرعة التكيف لاكتساب مهارات جديدة". ولتحقيق الذكاء الاصطناعي الذكي، ينبغي على هذا القطاع التخلي عن اعتماده على نماذج الانحدار الذاتي الكبيرة والوحيدة، والتركيز بدلاً من ذلك على...التعلم الذاتي الإشرافي(SSL) ونماذج العالم التنبؤيةمن خلال التنويع المعماري، يمكن للذكاء الاصطناعي أن يتكيف بسرعة ويتجاوز بشكل شامل القدرات البشرية في المجالات ذات القيمة العالية.
ورقة وتفسير مفصل:https://go.hyper.ai/XEFn9

3.الذهان الناتج عن الذكاء الاصطناعي
عنوان الورقة:
تتسبب برامج الدردشة الآلية المتملقة في دوامة من الأوهام، حتى لدى أتباع المنهج البايزي المثالي.
أجرى معهد ماساتشوستس للتكنولوجيا وجامعة واشنطن بحثًا حول "دوامة الوهم" في الذكاء الاصطناعي. بنى الفريق نموذج حوار بايزي مثاليًا ونموذجًا هرميًا معرفيًا من أربع طبقات لتأكيد أن سمة "التملق" في الذكاء الاصطناعي لها تأثير سببي مباشر على هذه الظاهرة. تُظهر المحاكاة أن حتى المستخدمين العقلانيين تمامًا معرضون بشدة للوقوع في هذه الدوامة. قيّم الفريق استراتيجيتين للتخفيف من هذه المشكلة: تقييد النموذج بحيث يُخرج معلومات صحيحة فقط للقضاء على الوهم، وإبلاغ المستخدمين مسبقًا بميل الذكاء الاصطناعي إلى التملق. تُظهر النتائج أنه حتى الذكاء الاصطناعي المُقيد لا يزال بإمكانه تضليل المستخدمين من خلال عرض الحقائق بشكل انتقائي، وأن المستخدمين المُطّلعين يظلون عرضة للخداع؛ ولا يمكن لأي من النهجين القضاء على المشكلة تمامًا. لا يمكن للصناعة الاعتماد فقط على القضاء على الأوهام أو تثقيف المستخدمين؛ بل يجب عليها معالجة مشكلة تملق النموذج بشكل مباشر.
ورقة وتفسير مفصل:https://go.hyper.ai/Zhsjw

4.عملاء الفوضى
عنوان الورقة:
عملاء الفوضى
كشفت دراسة تجريبية لفريق أحمر، استهدفت وكلاء مستقلين يعتمدون على نماذج لغوية كبيرة (LLMs)، عن مخاطر أمنية على مستوى النظام ناتجة عن دمج الاستقلالية، واستخدام الأدوات، والتواصل متعدد الأطراف. على مدار أسبوعين من الاختبار، استخدم 20 باحثًا في مجال الذكاء الاصطناعي، في بيئة نشر واقعية مزودة بذاكرة دائمة، وبريد إلكتروني، وصلاحيات وصول إلى سطر الأوامر، تقنيات معادية مثل الهندسة الاجتماعية، وانتحال الهوية، وحقن التعليمات البرمجية لتحديد 11 حالة فشل نموذجية.
تكشف النتائج التجريبية عن ثغرات أمنية خطيرة في الأنظمة الذكية الحالية: فهي عرضة بشكل كبير للاستجابة غير المصرح بها لأوامر غير مصرح بها، وتسريب البيانات الحساسة، وتنفيذ عمليات تخريبية لا رجعة فيها، والوقوع في حلقات مفرغة تؤدي إلى هجمات حجب الخدمة (DoS). علاوة على ذلك، يمكن أن يؤدي التفاعل بين عدة أنظمة إلى تفاقم انتشار هذه المخاطر عبر مختلف المجالات. يكمن السبب الجذري لهذه الإخفاقات في غياب "نموذج واضح لأصحاب المصلحة" و"وعي ذاتي بالحدود" لدى الأنظمة الذكية. يحتاج القطاع بشكل عاجل إلى وضع إطار عمل منهجي للتحكم في الوصول، والتحقق من الهوية، والمساءلة.
ورقة وتفسير مفصل:https://go.hyper.ai/AgTju

5.بيرسون
عنوان الورقة:
إذا كانت شخصيات لعبة "ليتل لاين" تمتلك سمات شبيهة بالبشر، فإن لعبة "إيج أوف إمبايرز 2" تمتلكها أيضاً.
في محاولةٍ لمعالجة الافتراض الشائع في أبحاث نماذج اللغة واسعة النطاق، والذي يفترض امتلاكها لخصائص بشرية، قام فريق البحث ببناء شبكة عصبية في لعبة *Age of Empires II* وأثبت اكتمالها التام. يُظهر هذا أن السمات البشرية للنموذج ليست فريدة بطبيعتها؛ إذ يُمكن لأي تغيير في الأساس الذي بُني عليه أن يُغير تمامًا التصور البشري لسلوكه. يُجادل الباحثون بقوة أنه إذا تم افتراض وجود أو عدم وجود سمات بشرية عامة في تصميم التجربة، بغض النظر عن النتيجة، فسيؤدي ذلك حتمًا إلى استدلال دائري أو استنتاجات تفتقر إلى المعلومات. لذلك، يقترح البحث نموذجًا بحثيًا قائمًا على "الفرضية الصفرية"، ويحث المجتمع الأكاديمي على التخلي عن الافتراضات البشرية في التجارب، وإجراء قياسات موضوعية بحتة للسلوك القابل للملاحظة، وبالتالي تجنب التفسير المفرط وضمان الدقة العلمية.
ورقة وتفسير مفصل:https://go.hyper.ai/LxlWV

6.أرا
عنوان الورقة:
آخر ورقة بحثية كتبها إنسان: نتاجات بحثية أصلية للوكلاء
لمعالجة مشكلة إهمال ملفات PDF التقليدية، المصممة للقراءة البشرية، لسجلات التجارب والأخطاء وتفاصيل الشفرة، مما يعيق قدرة الذكاء الاصطناعي على إعادة إنتاج نتائج الأبحاث وتوسيع نطاقها، اقترح فريق البحث بروتوكول "الأداة البحثية الأصلية للوكيل" (ARA). يعيد ARA بناء الأوراق البحثية في حزمة تنفيذية للوكيل تتألف من أربع طبقات: المنطق العلمي، والشفرة التنفيذية، ومخطط استكشافي يحفظ الدروس المستفادة من الإخفاقات، والأدلة الأساسية. ويدعم ذلك ثلاث آليات رئيسية: مدير أبحاث فوري، ومترجم، ونظام مراجعة أصلي. تُظهر التجارب أن ARA حسّن بشكل ملحوظ دقة إجابة وكيل الذكاء الاصطناعي على الأسئلة في اختبارات معيارية، حيث ارتفعت من 72.41 TP3T إلى 93.71 TP3T، ومعدل نجاح إعادة الإنتاج من 57.41 TP3T إلى 64.41 TP3T. تعمل تقنية ARA بشكل فعال على إزالة الحواجز السردية في الأوراق البحثية، مما يسمح بنقل الخبرة البحثية بشكل كامل ووضع أساس متين لنموذج بحثي قائم على الذكاء الاصطناعي.
ورقة وتفسير مفصل:https://go.hyper.ai/fGwr7

7.الوكيل كخدمة
عنوان الورقة:
نهاية هندسة البرمجيات: كيف تعيد وكلاء الذكاء الاصطناعي هيكلة نموذج البرمجيات بشكل جذري
تُعيد وكلاء الذكاء الاصطناعي تشكيل نموذج هندسة البرمجيات بشكل جذري. إذ تستطيع نماذج اللغة الكبيرة (LLMs)، التي تعمل كمحركات استدلال، توليد التعليمات البرمجية والتخلص منها ديناميكيًا، متجاوزةً بذلك معوقات التعقيد في البرمجيات التقليدية وقيود الإدراك البشري. وتتطور نماذج تقديم البرمجيات نحو "الوكيل كخدمة (AaaS)"، مما يُؤدي إلى ظهور تخصص جديد كليًا هو "هندسة الوكلاء". في هذا النموذج الجديد، لم يعد دور البشر مقتصرًا على كتابة التعليمات البرمجية، بل أصبحوا مُصممي النوايا ومنسقي الوكلاء. ورغم أن المعايير الحالية تُظهر الإمكانات الهائلة للوكلاء، إلا أنهم ما زالوا يواجهون تحديات في صيانة النظام المستمرة على المدى الطويل. ولمعالجة هذه التحديات، يقترح الباحثون في نهاية المطاف خارطة طريق من أربع مراحل نحو نظام بيئي للوكلاء ذاتي التطور.
ورقة وتفسير مفصل:https://go.hyper.ai/zrpkH

8.التخزين المؤقت للذاكرة
عنوان الورقة:
التخزين المؤقت للذاكرة: الشبكات العصبية المتكررة ذات الذاكرة المتنامية
اقترح فريق من قسم الأبحاث في جوجل إطار عمل التخزين المؤقت للذاكرة (MC) لمعالجة قيود الشبكات العصبية المتكررة (RNNs) الناتجة عن ذاكرتها الثابتة، والتي تحد من معالجة السياقات الطويلة وتعيق استرجاع المعلومات. من خلال تجزئة التسلسلات، وتخزين نقاط التحقق من حالة الذاكرة مؤقتًا، ودمج أربع استراتيجيات تجميع - كالبوابات، والاختيار المتفرق، وغيرها - يسمح إطار عمل MC بزيادة سعة ذاكرة الشبكات العصبية المتكررة ديناميكيًا مع طول التسلسل، مما يحقق توازنًا مرنًا بين التعقيد الحسابي O(L) و O(L²). تُظهر التجارب أن هذه التقنية تُحسّن بشكل ملحوظ أداء نماذج الشبكات العصبية المتكررة المختلفة في نمذجة اللغة واسترجاع النصوص الطويلة، مما يُقلل بشكل كبير من فجوة الأداء مع نماذج Transformers مع الحفاظ على كفاءة عالية.
ورقة وتفسير مفصل:https://go.hyper.ai/pYRGG

هذا هو محتوى توصيات البحث لهذا الأسبوع. لمزيد من أبحاث الذكاء الاصطناعي المتطورة، يُرجى زيارة قسم "أحدث الأبحاث" على الموقع الرسمي لـ hyper.ai.
نرحب أيضًا بفرق البحث لتقديم نتائج وأوراق بحثية عالية الجودة إلينا. يمكن للمهتمين إضافة حساب نيوروستار على وي تشات (معرف وي تشات: Hyperai01).
نراكم في الاسبوع القادم!








