LIGA-Stereo: تعلم تمثيلات واعية بالهندسة لليدار للكشف ثلاثي الأبعاد القائم على الاستريو

الكشف ثلاثي الأبعاد القائم على الصور الاستيريو يهدف إلى اكتشاف مكعبات الحدود الثلاثية الأبعاد من الصور الاستيريو باستخدام خرائط العمق الوسيطة أو تمثيلات الهندسة ثلاثية الأبعاد الضمنية، مما يوفر حلًا منخفض التكلفة للاستشعار ثلاثي الأبعاد. ومع ذلك، لا تزال أداؤه أقل فعالية مقارنة بخوارزميات الكشف القائمة على ليدار (LiDAR). للكشف عن وتحديد مواقع مكعبات الحدود الثلاثية الأبعاد بدقة، يمكن للنماذج القائمة على ليدار ترميز حدود الأجسام والاتجاهات الطبيعية للسطح بدقة من السحابات النقطية لليدار. ومع ذلك، فإن نتائج الكشف القائم على الصور الاستيريو تتأثر بسهولة بالخصائص الخاطئة للعمق بسبب قيود التوافق الاستيريو. لحل هذه المشكلة، نقترح استخدام LIGA-Stereo (مكتشف الصور الاستيريو المستشعر للهندسة ثلاثية الأبعاد لليدار) لتعلم كشف الأجسام ثلاثية الأبعاد القائم على الصور الاستيريو تحت إرشاد تمثيلات الهندسة عالية المستوى لنماذج الكشف القائمة على ليدار. بالإضافة إلى ذلك، وجدنا أن المكتشفات الاستيريو القائمة على البكسل الفائق فشلت في تعلم الخصائص الدلالية بشكل فعال من الإشراف الثلاثي الأبعاد غير المباشر. لذلك، نربط رأس كشف دلالي ثنائي الأبعاد مساعد لتوفير إشراف دلالي ثنائي الأبعاد مباشر. أظهرت نتائج التجارب أن هذين الاستراتيجيتين قدImproved the geometric and semantic representation capabilities. مقارنة بأحدث المكتشفات الاستيريو، طبقتنا قدحسنت أداء الكشف ثلاثي الأبعاد للسيارات والمشاة وراكبي الدراجات بمقدار 10.44٪ و5.69٪ و5.97٪ mAP على التوالي في مقاييس KITTI الرسمية. كما تم تقليص الفجوة بين المكتشفات ثلاثية الأبعاد القائمة على الصور الاستيريو والمكتشفات القائمة على ليدار.为了使句子更加流畅,以下是进一步优化后的版本:الكشف ثلاثي الأبعاد القائم على الصور الاستيريو يهدف إلى اكتشاف مكعبات الحدود الثلاثية الأبعاد من الصور الاستيريو باستخدام خرائط العمق الوسيطة أو تمثيلات الهندسة ثلاثية الأبعاد الضمنية، مما يوفر حلًا منخفض التكلفة للاستشعار ثلاثي الأبعاد. ومع ذلك، لا تزال أداؤه أقل فعالية مقارنة بخوارزميات الكشف القائمة على ليدار (LiDAR). لتحقيق الكشف الدقيق وت lokalize مواقع مكعبات الحدود الثلاثية الأبعاد، يمكن لنماذج الكشف القائمة على ليدار استخلاص حدود الأجسام والاتجاهات الطبيعية للسطح بدقة من السحابات النقطية لليدار. ولكن نتيجة للقيود المتعلقة بالتوافق الاستيريو، فإن نتائج الكشف القائم على الصور الاستيريو تكون عرضة للتغير بسبب الخصائص الخاطئة للعمق.لحل هذه المشكلة، نقترح استخدام LIGA-Stereo (مكتشف الصور الاستيريو المستشعر للهندسة ثلاثية الأبعاد لليدار)، وهو إطار عمل يتيح تعلم كاشفي الأجسام ثلاثية الأبعاض المستخدمين للصور الاستيريو تحت إرشاد تمثيلات الهندسة عالية المستوى التي توفرها نماذج الكشف القائمة على ليدار. بالإضافة إلى ذلك، اكتشفنا أن المكتشفات الاستيريو التقليدية التي تعتمد على البكسل الفائق لم تستطع تعلم الخصائص الدلالية بشكل فعال من الإشراف الثلاثي الأبعاض غير المباشر. لذلك، قمنا بإضافة رأس كشف دلالى ثنائي الابعاد مساعد لتوفير إشراف دلالي ثنائي الابعاد مباشر.أظهرت النتائج التجريبية أن هذين الإجراءين قد زيدا قدرة التمثيل الهندسي والدلالي بشكل كبير. بالمقارنة مع أفضل المكتشفات المستخدمة للصور الاستيريو حتى الآن (state-of-the-art stereo detector)، فقد حسنت طريقتنا أداء الكشف الثلاثي الابعاد بالنسبة للسيارات والمشاة وراكبي الدراجات بمعدل 10.44٪ و5.69٪ و5.97٪ mAP على التوالي في مقاييس KITTI الرسميه (official KITTI benchmark). هذا الأمر يقلل الفرق بين أداء المكتشفات الثلاثيه الابعاد المستخدمه للصور الاستريو وأداء تلك المستخدمة لليدار.请注意,我已经对句子进行了适当的调整以适应阿拉伯语的表达习惯,并且在一些不常见的术语后面加上了英文标注。希望这个翻译能符合您的要求。