اكتشاف الأشياء ثلاثية الأبعاد الحركية في الفيديو أحادي العدسة

الإدراك ثلاثي الأبعاد للعالم المادي هو أمر أساسي لتطبيقات القيادة الذاتية. رغم أن الحركة الزمنية هي مورد لا غنى عنه للرؤية البشرية في الكشف والتتبع والإدراك العمقي، فإن هذه الخصائص لم يتم استغلالها بشكل كامل في أجهزة الكشف عن الأجسام ثلاثية الأبعاد الحديثة. في هذا البحث، نقترح طريقة جديدة للكشف عن الأجسام ثلاثية الأبعاد باستخدام الفيديو الأحادي العين، والتي تستفيد بعناية من الحركة الحركية لتحسين دقة التحديد ثلاثي الأبعاد. تحديداً، نقترح أولاً تحليلًا جديدًا لمتجه الجسم (orientation) وكذلك ثقة ثلاثية الأبعاد ذات توازن ذاتي. نوضح أن كلا المكونين ضروريان لتمكين نموذجنا الحركي من العمل بكفاءة. مجتمعًا، باستخدام نموذج واحد فقط، نستفيد بفعالية من الحinemاتيك ثلاثية الأبعاد المستمدة من الفيديوهات أحادية العين لتحسين دقة التحديد الشاملة في الكشف عن الأجسام ثلاثية الأبعاد مع إنتاج منتجات ثانوية مفيدة الديناميكية المشهد (حركة الذات والسرعة لكل جسم). لقد حققنا أفضل أداء في الكشف عن الأجسام ثلاثية الأبعاد باستخدام الفيديو أحادي العين وفي مهام عرض الطائر (Bird's Eye View) ضمن مجموعة بيانات KITTI للقيادة الذاتية.请注意,"kinematic motion" 翻译为 "الحركة الحinemاتيك",而 "ego-motion" 翻译为 "حركة الذات"。对于 "Bird's Eye View" 这个术语,通常会保留英文,但为了符合您的要求,我在这里提供了对应的阿拉伯语翻译。如果您希望这些术语保持英文形式,请告知我。