التاريخ

منذ شهر واحد

المؤسسة

رابط الورقة البحثية

الوسوم

تم اقتراح مفهوم التعلم أثناء النشر (LWD) في عام 2026 من قبل باحثين من معهد شنغهاي للابتكار، وشركة AIZ للروبوتات، وجامعة كولومبيا. وقد نُشرت نتائج البحث ذات الصلة في ورقة بحثية. التعلم أثناء النشر: التعلم المعزز على نطاق الأسطول لسياسات الروبوتات العامة .

LWD هو إطار عمل قابل للتطوير يجمع بين نشر أساطيل الروبوتات على نطاق واسع والتعلم المعزز من البيانات غير المتصلة بالإنترنت إلى البيانات المتصلة. وهو يعالج بشكل أساسي تحديات "انزياح التوزيع وفشل الذيل الطويل" في نماذج الرؤية-اللغة-الفعل (VLA) العامة التي تؤدي مهامًا في بيئات واقعية معقدة، وذلك بسبب الاعتماد كليًا على البيانات المدربة مسبقًا غير المتصلة بالإنترنت. يقدم هذا الإطار التعلم الضمني الموزع للقيمة (DIVL) والتعلم Q القائم على المطابقة المرافقة (QAM) لتجميع البيانات باستمرار من تفاعلات الروبوتات المستقلة والتدخل البشري في عمليات النشر الواقعية، مما يتيح تكرارًا مستقرًا لنموذج السياسة دون الانحراف عن سيناريو التطبيق الفعلي. تُظهر نتائج البحث أن LWD يتغلب بفعالية على عنق الزجاجة في التعلم الناتج عن المكافآت المتفرقة، مما يعزز بشكل كبير قابلية التكيف وقدرة التعميم للنماذج العامة في مختلف البيئات المادية الواقعية. في ثمانية سيناريوهات واقعية معقدة، بما في ذلك تخزين السوبر ماركت، وتحضير الشاي، وخلط الكوكتيلات، حقق نموذج سياسة عام واحد معدل نجاح متوسط للمهمة يصل إلى 951 TP3T وقلل بشكل كبير من وقت تنفيذ المهام طويلة الأجل.

التعلم الموحد

نهج التعلم الآلي اللامركزي الذي يحتفظ ببيانات التدريب على جهاز محلي ويدرب نموذجًا عالميًا مشتركًا من خلال تجميع تحديثات النموذج المحسوبة محليًا فقط.

منذ 2 أشهر

نموذج العمل العالمي (وام)

WAM عبارة عن بنية نموذجية أساسية جديدة للذكاء الاصطناعي في مجالات الذكاء المجسد والروبوتات.

منذ شهر واحد

تعزيز الفكر الموجه

يمكن لتقنية GTR أن توجه عملية التفكير النموذجي في البيئات البصرية المعقدة وتمنع "انهيار الدماغ".

منذ 2 أشهر

نظرية الفضاء

تشير النظرية المكانية إلى إطار عمل قدرة العامل الذكي على بناء وتحديث واستخدام المعتقدات المكانية في بيئة ذات معلومات غير كاملة من خلال الاستكشاف النشط.

منذ 2 أشهر

كلب الصيد الكثيف

يُعد محرك البحث الكثيف مسؤولاً عن إيجاد الفقرات الأكثر صلة بدلالات الاستعلام بسرعة من مكتبة وثائق ضخمة، وهو المكون الأساسي لنظام توليد تحسين البحث.

منذ 2 أشهر

التقطيع الجشع لعائد الذروة

تعمل PRGS بشكل كبير على تحسين قدرة نماذج التعلم المعزز غير المتصلة بالإنترنت على ربط التجارب ذات المكافآت العالية.

منذ 2 أشهر

طريقة مقارنة السلامة: تنبيهات السلامة البصرية المتوافقة بعمق

يحل هذا النظام بفعالية التحديات الرئيسية في عملية المحاذاة الآمنة لـ LVLM.

منذ 3 أشهر

طريقة التعرف على بصمات الأصابع iSeal

يحقق iSeal معدل نجاح بصمة 100% (FSR) ضد أكثر من 10 هجمات على 12 LLMs.

منذ 3 أشهر

استراتيجية متوسط السرعة (MVP)

يحقق MVP توليد الحركة بخطوة واحدة مع كل من القدرة التعبيرية العالية والحساب السريع للغاية من خلال نمذجة مجال السرعة المتوسط.

منذ 2 أشهر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار