إدراك بطيء
الإدراك البطيء هو تقنية تستخدم في مجال الذكاء الاصطناعي لتحسين قدرات التفكير البصري للنماذج المتعددة الوسائط الكبيرة. تم اقتراحه بشكل مشترك من قبل فريق StepFun وجامعة Beihang في عام 2025. ويهدف إلى تقسيم عملية الإدراك لتحقيق إدراك دقيق للأشكال الهندسية وما إلى ذلك، وذلك لتحسين أداء النماذج متعددة الوسائط الكبيرة في مهام التفكير البصري. نتائج الورقة ذات الصلة هيالإدراك البطيء: دعونا ندرك الأشكال الهندسية خطوة بخطوة".
ينقسم الإدراك البطيء إلى مرحلتين:
- تحلل الإدراك: تحلل الأشكال الهندسية إلى وحدات شكلية أساسية - خطوط، وتوحيد التمثيلات الهندسية المعقدة، وتجنب مشاكل التحسين المتعددة الوسائط، وتحقيق هدف "تبسيط المعقد". يؤدي هذا إلى تجنب الأخطاء التي قد تحدث عندما يتعامل النموذج مع الأشكال الهندسية المعقدة، مثل مشاكل تعشيش المضلع.
- تدفق الإدراك: يعتمد النموذج على مسطرة إدراك افتراضية، والتي ترسم تدريجيًا مقطع الخط من نقطته الأولية إلى نقطته النهائية. تتم صياغة عملية إدراك جزء خط طويل على أنها عملية الوصول إلى نقطة القرار التالية من خلال حركات سريعة متعددة من نقطة القرار. يؤدي هذا إلى تمديد وقت التفكير على مستوى الإدراك لتحسين قدرة النموذج على التنبؤ بدقة بأجزاء الخطوط.
يؤدي الإدراك البطيء إلى تحسين قدرة النموذج على تحليل الأشكال الهندسية المعقدة بشكل كبير من خلال محاكاة الطريقة التي يقوم بها البشر بتحليل الأشكال الهندسية خطوة بخطوة. ولم تُظهر هذه الطريقة تحسينات كبيرة في الأداء في التجارب فحسب، بل كشفت أيضًا عن قانون توسيع وقت الاستدلال، أي تحسين دقة التحليل من خلال زيادة التعقيد الحسابي. يقدم هذا الاكتشاف أفكارًا جديدة لمهمة تحليل الأشكال الهندسية في الرؤية الحاسوبية.