HyperAIHyperAI
منذ 17 أيام

PULSE: تحسين دقة الصور تلقائيًا عبر الاستكشاف الفضائي الخفي للنماذج التوليدية

Sachit Menon, Alexandru Damian, Shijia Hu, Nikhil Ravi, Cynthia Rudin
PULSE: تحسين دقة الصور تلقائيًا عبر الاستكشاف الفضائي الخفي للنماذج التوليدية
الملخص

الهدف الرئيسي لتقنية تحسين الدقة من صورة واحدة هو إنشاء صور عالية الدقة (HR) من مدخلات منخفضة الدقة (LR) المقابلة لها. في الطرق السابقة، التي كانت عادةً مُراقبة، كان الهدف التدريبي يقيس عادةً المسافة المتوسطة بين بكسلات الصور المُحسّنة (SR) والصور عالية الدقة (HR). يؤدي تحسين هذه المقاييس غالبًا إلى توهين الصورة، خاصة في المناطق ذات التباين العالي (التي تحتوي على تفاصيل دقيقة). نقترح صيغة بديلة لمشكلة تحسين الدقة تعتمد على إنشاء صور مُحسّنة واقعية تُخفض بدقة إلى الصورة المنخفضة الدقة الأصلية. نقدّم خوارزمية تعالج هذه المشكلة، تُدعى PULSE (تحسين دقة الصورة عبر استكشاف الفضاء الخفي)، والتي تُولّد صورًا عالية الدقة وواقعية بدرجات دقة لم تُسجّل من قبل في الأدبيات العلمية. تحقق هذه الخوارزمية ذلك بطريقة بالكامل ذاتية المراقبة، ولا تُقيد بعامل تشوه معين تم استخدامه أثناء التدريب، على عكس الطرق السابقة التي تتطلب تدريبًا مُراقبًا على قواعد بيانات من أزواج صور منخفضة الدقة وعالية الدقة. بدلًا من البدء بالصورة منخفضة الدقة وإضافة التفاصيل تدريجيًا، تقوم PULSE باستكشاف متعدّد الصور الطبيعية عالية الدقة، بحثًا عن صور تُخفض بدقة إلى الصورة منخفضة الدقة الأصلية. يتم توثيق هذا النهج من خلال ما يُسمى "خسارة التقليل"، التي توجّه عملية الاستكشاف عبر الفضاء الخفي لنموذج توليد صور. وباستغلال خصائص التوزيعات الطبيعية عالية الأبعاد، نحدّد مجال البحث لضمان إخراج صور واقعية. وبهذا، تُولّد PULSE صورًا مُحسّنة تتمتع بواقعية عالية وتُخفض بدقة إلى الصورة الأصلية. نُظهر مثالًا تجريبيًا على فعالية منهجنا في مجال تحسين دقة الوجوه (أي توليد وجوه افتراضية). كما نقدّم مناقشة حول القيود والتحيّزات التي تتصف بها الطريقة كما هي مطبقة حاليًا، مع إرفاق بطاقة نموذج تحتوي على مقاييس ذات صلة. وتفوق طريقةنا الطرق الرائدة في الجودة الإدراكية عند دقة أعلى وعوامل تكبير أكبر مما كان ممكنًا سابقًا.