تقدير العمق من صورة واحدة مدرب عبر مؤشرات العمق من عدم الحدة

تقدير العمق من صورة واحدة باللون (RGB) هو مهمة أساسية في رؤية الحاسوب، والتي يتم حلها بشكل مباشر باستخدام التعلم العميق المشرف عليه. في مجال التعلم غير المشرف عليه لتقدير العمق من صورة واحدة باللون (RGB)، لا يتم تقديم العمق بشكل صريح. تعمل الدراسات الحالية في هذا المجال إما على زوج استريو، أو فيديو أحادي العين، أو عدة آراء، وتستخدم خسائر تعتمد على تقنية بناء الهيكل من الحركة (Structure-from-Motion) لتدريب شبكة تقدير العمق. في هذه الدراسة، نعتمد بدلاً من الآراء المختلفة على عمق الإشارات البؤرية (Focus Cues). يتمОсновывается التعلم على طبقة ت💬volution جديدة تعتمد على دالة انتشار النقطة (Point Spread Function)، والتي تطبق نواة محددة للموقع تنشأ من دائرة الالتباس (Circle-Of-Confusion) في كل موقع للصورة. قمنا بتقييم طريقتنا على بيانات مشتقة من خمسة مجموعات بيانات شائعة لتقدير العمق وصور المجال الضوئي (Lightfield Images)، ونقدم نتائجًا تنافس الأساليب المشرفة عليها في مجموعتي البيانات KITTI و Make3D وتفوق الأساليب التي تعتمد على التعلم غير المشرف عليه. بما أن ظاهرة تقدير العمق من عدم التركيز ليست خاصة بمجموعة بيانات معينة، فإننا نفترض أن التعلم المستند إليها سيقلل من الانحياز الزائد إلى المحتوى الخاص بكل مجموعة بيانات. أظهرت تجاربنا أن هذا هو الحال بالفعل، وأن المحرك الذي تم تعلمه باستخدام طريقتنا على مجموعة بيانات واحدة يوفر نتائج أفضل عند استخدامه على مجموعات بيانات أخرى مقارنة بالأساليب المشرفة عليها مباشرة.