HyperAIHyperAI
منذ 2 أشهر

CurveFormer: اكتشاف المسارات ثلاثية الأبعاد من خلال نشر المنحنيات باستخدام استعلامات المنحنيات والانتباه

Bai, Yifeng ; Chen, Zhirong ; Fu, Zhangjie ; Peng, Lang ; Liang, Pengpeng ; Cheng, Erkang
CurveFormer: اكتشاف المسارات ثلاثية الأبعاد من خلال نشر المنحنيات باستخدام استعلامات المنحنيات والانتباه
الملخص

الكشف عن المسارات ثلاثية الأبعاد هو جزء أساسي من أنظمة القيادة الذاتية. عادةً ما تولد الطرق السابقة التي تعتمد على الشبكات العصبية التلافيفية (CNN) والترانسفورمر (Transformer) خريطة ميزات منظر الطائر (BEV) من الصورة الأمامية، ثم تستخدم شبكة فرعية بخريطة الميزات هذه كمدخل لتنبؤ المسارات ثلاثية الأبعاد. تتطلب مثل هذه النهج تحويلة نظر صريحة بين المنظر الطائر والمنظر الأمامي، وهي مشكلة لا تزال صعبة. في هذا البحث، نقترح CurveFormer، وهو طريقة قائمة على الترانسفورمر في مرحلة واحدة تقوم بحساب معلمات المسار ثلاثي الأبعاد مباشرة وتجنب الخطوة الصعبة لتحويلة المناظر. بشكل خاص، نصوغ الكشف عن المسارات ثلاثية الأبعاد كمشكلة انتشار المنحنيات باستخدام استعلامات المنحنيات. يتم تمثيل استعلام المسار ثلاثي الأبعاد بمجموعة نقاط ربط ديناميكية ومنظمة. بهذه الطريقة، تقوم الاستعلامات ذات التمثيل المنحني في محكّم الترانسفورمر (decoder) بتحسين نتائج الكشف عن المسارات ثلاثية الأبعاد بشكل متكرر. بالإضافة إلى ذلك، تم تقديم وحدة انتباه متقاطع للمنحنيات لحساب التشابهات بين استعلامات المنحنيات وميزات الصورة. كما تم توفير وحدة عينة السياق التي يمكنها التقاط المزيد من الميزات النسبية للصورة الخاصة باستعلام المنحنى لتعزيز أداء الكشف عن المسارات ثلاثية الأبعاد بشكل أكبر. قمنا بتقييم طرقنا للكشف عن المسارات ثلاثية الأبعاد على مجموعة بيانات اصطناعية وعلى بيانات حقيقية من العالم الحقيقي، وأظهرت النتائج التجريبية أن طرقنا تحقق أداءً واعداً مقارنة بالأساليب الرائدة الأخرى. وقد تم التحقق من فعالية كل مكون عبر دراسات الإلغاء الجزئي.请注意,为了保持专业性和准确性,我保留了某些技术术语的英文缩写,如“CNN”、“Transformer”、“BEV”和“decoder”。这些在阿拉伯语科技文献中通常也会直接使用英文缩写。

CurveFormer: اكتشاف المسارات ثلاثية الأبعاد من خلال نشر المنحنيات باستخدام استعلامات المنحنيات والانتباه | أحدث الأوراق البحثية | HyperAI