HyperAIHyperAI
منذ 4 أشهر

توليد واستغلال تقديرات العمق الأحادية البصرية الاحتمالية

Zhihao Xia; Patrick Sullivan; Ayan Chakrabarti
توليد واستغلال تقديرات العمق الأحادية البصرية الاحتمالية
الملخص

بما يتجاوز تقدير العمق من صورة واحدة، فإن الدليل الأحادي العين مفيد في نطاق أوسع من تطبيقات وظروف استدلال العمق---مثل عند الاستفادة من أدلة عمق أخرى متاحة لتحسين الدقة. حاليًا، يتم حل تطبيقات مختلفة ذات مهام استدلال مختلفة ومجموعات مختلفة من أدلة العمق عبر شبكات متخصصة مختلفة---مُدرَّبة بشكل منفصل لكل تطبيق. بدلاً من ذلك، نقترح نموذجًا أحادي العين متعدد الاستخدامات لا يعتمد على المهمة، والذي ينتج توزيع احتمالي للعمق في المشهد بناءً على صورة ملونة مدخلة، كتقريب لعينات النواتج من VAE شرطي قائم على الرقع (Patch-wise Conditional VAE). نوضح أن هذا الإخراج التوزيعي يمكن استخدامه لتمكين مجموعة متنوعة من مهام الاستدلال في ظروف مختلفة، دون الحاجة إلى إعادة التدريب لكل تطبيق. عبر مجموعة متنوعة من التطبيقات (إكمال العمق، التقدير بارتكاب المستخدم، إلخ)، يقدم نموذجنا المشترك نتائجًا عالية الدقة---متناسقة مع أو تتفوق على طرق الحالة الفنية المعتمدة على شبكات خاصة بالتطبيق.