Vishaal Udandarao Shyamgopal Karthik Surabhi S. Nath Andreas Hochlehnert Matthias Bethge Ameya Prabhu

الملخص
يهدف مشروع كامبرياني-أس إلى اتخاذ الخطوات الأولى نحو تحسين نماذج العالم المرئية من خلال إدخال مفهوم "الاستشعار المكاني الفائق" (spatial supersensing)، وذلك من خلال اقتراح (أ) معيارين معياريين: VSI-Super-Recall (VSR) وVSI-Super-Counting (VSC)، و(ب) استراتيجيات تنبؤية مخصصة للاستدلال (predictive sensing inference strategies) مُعدّة خصيصًا لكل معيار. في هذا العمل، نُجري تحليلًا نقديًا لمشروع كامبرياني-أس من خلال هذين الجوانب. أولاً، نقدّم نموذجًا أساسيًا بسيطًا يُسمى NoSense، والذي يتجاهل معظم البنية الزمنية ويستخدم فقط نموذج SigLIP القائم على "مجموعة كلمات" (bag-of-words)، ومع ذلك يتمكن من حل معيار VSR بدقة شبه مثالية، حيث يصل إلى دقة 95% حتى على مقاطع فيديو مدتها أربع ساعات. وهذا يدل على أن معايير مثل VSR يمكن حلها تقريبًا دون الحاجة إلى إدراك مكاني أو نمذجة للعالم أو استخدام الاستشعار المكاني الفائق. ثانيًا، نفترض أن الاستراتيجيات المخصصة للاستدلال التي اقترحها كامبرياني-أس تستغل على الأرجح خوارزميات مختصرة (shortcut heuristics) موجودة في المعيار. ونوضح ذلك من خلال اختبار بسيط للتحقق من الصحة على معيار VSC، يُدعى VSC-Repeat: حيث نقوم بربط كل فيديو بنفسه مرة واحدة إلى خمس مرات، مما لا يغيّر عدد الكائنات الفريدة في الفيديو. ومع ذلك، فإن هذه التحوير البسيط يؤدي إلى انهيار كامل للدقة النسبية المتوسطة لمشروع كامبرياني-أس من 42% إلى 0%. ينبغي على نظام يقوم بالاستشعار المكاني الفائق ويعمل على دمج المعلومات عبر التجارب المختلفة أن يتعرف على مشاهد نفس المشهد ويحافظ على تنبؤات عدّ الكائنات دون تغيير؛ لكن خوارزمية الاستدلال في كامبرياني-أس تعتمد بشكل كبير على خوارزمية مختصرة موجودة في معيار VSC، وهي أن الغرف لا تُزور مجددًا أبدًا. وبشكل عام، تشير نتائجنا إلى أن (أ) المعايير الحالية لـ VSI-Super لا تقيس بعد بشكل موثوق الاستشعار المكاني الفائق، و(ب) تحسين الأداء الناتج عن وصفات الاستدلال التنبؤية المستخدمة في كامبرياني-أس ينشأ نتيجة لاستغلال غير مقصود لطرق مختصرة، وليس نتيجة لاستشعار مكاني فائق قوي ومستقر. وندرج ردّ المؤلفين المُشَرَّعَين لمشروع كامبرياني-أس (في المضاعف أ) لتوفير منظور متوازن إلى جانب مطالعنا.
بناء الذكاء الاصطناعي بالذكاء الاصطناعي
من الفكرة إلى الإطلاق — عجّل تطوير الذكاء الاصطناعي الخاص بك من خلال البرمجة المشتركة المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.