HyperAIHyperAI
منذ 2 أشهر

استرجاع الصور المركبة مع ملاحظات نصية من خلال تنظيم عدم اليقين متعدد الحبوب

Chen, Yiyang ; Zheng, Zhedong ; Ji, Wei ; Qu, Leigang ; Chua, Tat-Seng
استرجاع الصور المركبة مع ملاحظات نصية من خلال تنظيم عدم اليقين متعدد الحبوب
الملخص

نقوم بدراسة استرجاع الصور المركبة مع ملاحظات نصية. يقوم المستخدمون تدريجياً بالبحث عن الهدف المطلوب من خلال التحول من الملاحظات الخشنة إلى الدقيقة. ومع ذلك، فإن الأساليب الحالية تركز فقط على البحث الدقيق، وذلك من خلال استخدام الأزواج الإيجابية والسلبية أثناء التدريب. هذا النموذج القائم على الأزواج يأخذ بعين الاعتبار المسافة بين نقطة واحدة ونقطة أخرى فقط، مما لا يتماشى مع عملية الاسترجاع الخشنة التي تعتمد على العلاقة بين نقطة واحدة وعدد كبير من النقاط، مما يؤدي إلى تقليل معدل الاسترجاع. في محاولة لسد هذه الفجوة، نقدم نهجاً موحداً للتعلم يمكنه نمذجة الاسترجاع الخشن والدقيق بشكل متزامن عبر الأخذ بعين الاعتبار عدم اليقين متعدد الطبقات. الفكرة الأساسية التي تقف وراء الطريقة المقترحة هي دمج الاسترجاع الدقيق والخشنة كتطابق لنقاط البيانات ذات التقلبات الصغيرة والكبيرة، على التوالي. وبشكل خاص، يتضمن طرحتنا فصلين: (1) نمذجة عدم اليقين، والتي تحاكي الاستفسارات متعددة الطبقات بإدخال تقلبات موزعة بشكل متطابق في فضاء السمات (2) تنظيم عدم اليقين، حيث نقدم تنظيماً إضافياً لعدم اليقين لتعديل هدف التطابق بناءً على نطاق التقلبات. بالمقارنة مع الأساليب الحالية، يعمل الإستراتيجية المقترحة بشكل صريح على منع النموذج من إبعاد المرشحين المحتملين في المرحلة الأولى، وبالتالي يحسن معدل الاسترجاع. وعلى ثلاث قواعد بيانات عامة وهي FashionIQ وFashion200k وShoes، حققت الطريقة المقترحة دقة استرجاع +4.03٪ و+3.38٪ و+2.40٪ على التوالي عند مقارنتها بأساس قوي للمقارنة.请注意,这里的翻译已经尽量遵循了您的要求,包括内容准确性、表达流畅性、表述正式性和忠于原文。如果您需要进一步的调整或有特定术语需要特别处理,请告知我。

استرجاع الصور المركبة مع ملاحظات نصية من خلال تنظيم عدم اليقين متعدد الحبوب | أحدث الأوراق البحثية | HyperAI