فريق جامعة جiaoDa يطور طريقة جديدة لتحسين أداء نماذج التقطيع الأساسية باستخدام فضاء البحث المتنوع في مؤتمر IEEE/CVF الدولي لرؤية الكمبيوتر (ICCV)
فريق من مركز الابتكار للسيارات الكهربائية الذكية والمتصلة في جامعة جiao Tong، برئاسة الدكتور زانغ سونغ آن، قد نشر ورقته البحثية "تحسين نماذج الفرز الأساسية باستخدام فضاء بحث متنوع" في المؤتمر الدولي الرائد للرؤية الحاسوبية ICCV. الباحث الرئيسي في هذه الدراسة هو إي لي، طالب ماجستير مشترك من كلية بويوان للتكنولوجيا المستقبلية في جامعة شنغهاي جياوتونغ للسنة الدراسية 2023. نماذج الفرز الأساسية تكون غالبًا فعالة في مجال الصور التقليدية، ولكنها تواجه تحديات في التعامل مع الصور الغير تقليدية مثل الكائنات المموهة أو الصور الطبية. كما أن صعوبة إعداد المجموعات الضخمة من البيانات والقيود الزمنية تجعل تعديل هذه النماذج عملية صعبة. لذا، واحدة من الأساليب الممكنة لتحسين أداء الفرز هي استخدام تقنيات تحسين الصور قبل التطبيق. حالياً، الطرق الأكثر شيوعاً لتحسين الصور تعتمد على القواعد الثابتة التي تحد من كفاءة التحسين. بينما تقدم الطرق المستندة إلى التعلم تحسينات متعددة ومتنوعة، إلا أنها تتنبأ بدرجات غير قابلة للوصف (مثل تقدير العمق)، مما يخلق ما يعرف بفضاء البحث المتنوع. في هذا السياق، اقترح الباحثون نموذج "التحسين التكيفي" الذي يستبدل التقنيات اليدوية التقليدية بأفضل استراتيجية تحسين مستندة إلى التعلم لتحسين دقة الفرز. هذا النماذج يدمج 32 تقنية تحسين مختلفة، منها 22 تقنية تعتمد على القواعد و10 تقنيات تعتمد على التعلم، مما يساعد في حل مشكلة عدم التطابق بين البارامترات. بالإضافة إلى ذلك، تم تطبيق تقنية التقطير لتسرع عملية التحسين، مما يجعلها أكثر فعالية في السيناريوهات العملية. تم اختبار فعالية هذه الطريقة على تسعة مجموعات بيانات علنية، وأظهرت تحسنًا ملحوظًا في أداء الفرز. هذه المجموعات تشمل NJU2k، VT1k، CAMO، NC4k، COD10k، Kvasir-SEG، BUSI، KoletorSDDV2 و MTSD. إي لي هو طالب ماجستير في مجال المعلومات الإلكترونية في كلية بويوان للتكنولوجيا المستقبلية بمدرسة جامعة شنغهاي جياوتونغ، ويركز أبحاثه على الرؤية الحاسوبية والتعلم التلقائي وتكييف نماذج الفرز. الدكتور زانغ سونغ آن هو أستاذ مساعد في كلية بويوان للتكنولوجيا المستقبلية، وهو عضو في مركز الابتكار للسيارات الكهربائية الذكية والمتصلة. يتميز بخبرة كبيرة في تصميم خوارزميات القرارات للسيارات الذاتية القيادة وقد نشر أكثر من 30 ورقة بحثية في مجلات ومؤتمرات مرموقة مثل TITS، TIV، CVPR و ICCV. حصل على درجة البكالوريوس في الهندسة الميكانيكية من جامعة Tsinghua في عامي 2013 و 2016، ثم على الدكتوراه من قسم الهندسة الميكانيكية في جامعة ميشيغان الأمريكية في عام 2021، تحت إشراف البروفيسور هوي بينغ، مدير Mcity. بعد التخرج، عمل كباحث في معهد الروبوتات التابع لشركة فورد الأمريكية، وكان رئيس مجموعة تقييم المشاريع المشتركة بين فورد والجامعات في مجال الروبوتات. في عام 2023، التحق بالكلية بويوان للتكنولوجيا المستقبلية في جامعة شنغهاي جياوتونغ، حيث يركز أبحاثه على خوارزميات القرارات والتحكم في السيارات الذكية والروبوتات، التعلم التلقائي، التعلم التلقائي المعمم، الذكاء المتجسد الصناعي، وتصميم المحركات النفاثة بمساعدة الذكاء الاصطناعي.