Command Palette
Search for a command to run...
تعلم جداول البحث ثلاثية الأبعاد المتكيفة مع الصورة لتحسين الصور الفوتوغرافية بفعالية عالية في الوقت الحقيقي
تعلم جداول البحث ثلاثية الأبعاد المتكيفة مع الصورة لتحسين الصور الفوتوغرافية بفعالية عالية في الوقت الحقيقي
Hui Zeng Jianrui Cai Lida Li Zisheng Cao Lei Zhang
الملخص
شهدت السنوات الأخيرة زيادة شعبية الطرق القائمة على التعلم لتحسين الألوان واللمسات الفنية للصور. ومع ذلك، فإن العديد من طرق تحسين الصور الحالية إما تقدم نتائج غير مرضية أو تستهلك الكثير من الموارد الحسابية والذاكرة، مما يعيق تطبيقها على الصور ذات الدقة العالية (عادةً ما تكون بحجم أكبر من 12 ميجابكسل) في الممارسة العملية. في هذا البحث، نتعلم جداول البحث ثلاثية الأبعاد (3D LUTs) المتكيفة مع الصورة لتحقيق تحسين سريع وموثوق للصور. تعتبر جداول البحث ثلاثية الأبعاد (3D LUTs) مستخدمة بشكل واسع لتغيير ألوان وتدرجات الصور، ولكنها عادةً ما يتم ضبطها يدويًا وتثبيتها في خط أنابيب تصوير الكاميرا أو أدوات تحرير الصور. ولأول مرة حسب علمنا، نقترح تعلم جداول البحث ثلاثية الأبعاد (3D LUTs) من البيانات المشمولة بالتعليقات باستخدام التعلم الثنائي أو الغير مقترن. وأكثر أهمية من ذلك، فإن جدول البحث الثلاثي الأبعاد الذي نتعلمه هو متكيف مع الصورة لتحسين الصور بمرنّة عالية. نتعلم عدة جداول أساسية ثلاثية الأبعاد (3D LUTs) وشبكة عصبية متلافهة صغيرة (CNN) في آن واحد وبطريقة شاملة من النهاية إلى النهاية. تعمل الشبكة العصبية المتلافهة الصغيرة على إصدار مخفض الدقة للصورة الإدخال لتنبؤ أوزان تعتمد على المحتوى لدمج الجداول الأساسية الثلاثية الأبعاد في جدول واحد متكيف مع الصورة، والذي يستخدم لتحويل ألوان وتدرجات الصور المصدر بكفاءة عالية. يحتوي نموذجنا على أقل من 600 ألف معلمة ويستغرق أقل من 2 ملي ثانية لمعالجة صورة بدقة 4K باستخدام بطاقة رسوميات Titan RTX واحدة. بينما يتميز بكفاءته العالية، فإن نموذجنا أيضًا يتفوق بشكل كبير على أفضل طرق تحسين الصور الحالية فيما يتعلق بمقياس نسبة الإشارة إلى الضوضاء (PSNR)، ومقياس تماثل الهياكل (SSIM)، ومقياس الاختلاف اللوني على قاعدتين بيانات عامتين متاحين للجمهور.请注意,对于一些专有名词如“convolutional neural network”(卷积神经网络)和“Titan RTX”(泰坦RTX),我保留了英文原名并在首次出现时提供了中文解释,以确保信息的完整性。在阿拉伯语中,这些术语通常也会保留英文原名。