Command Palette
Search for a command to run...
نحو استعادة الوجوه المعمية بطرق متينة باستخدام محول البحث في الكتابة
نحو استعادة الوجوه المعمية بطرق متينة باستخدام محول البحث في الكتابة
Shangchen Zhou Kelvin C.K. Chan Chongyi Li Chen Change Loy
الملخص
إعادة الوجوه المخفية هي مشكلة شديدة التعقيد غالباً ما تتطلب إرشادات مساعدة لـ 1) تحسين التحويل من المدخلات المتدهورة إلى المخرجات المرغوبة، أو 2) تعويض التفاصيل ذات الجودة العالية التي فقدت في المدخلات. في هذا البحث، نوضح أن استخدام قاموس رمزي متعلم في فضاء بسيط يقلل بشكل كبير من الغموض والالتباس في عملية الإعادة عن طريق تحويل إعادة الوجوه المخفية إلى مهمة تنبؤ بالرموز، مع توفير ذرات بصرية غنية لإنشاء وجوه ذات جودة عالية. وفقًا لهذا النموذج، نقترح شبكة تنبؤ قائمة على تقنية Transformer، والتي أطلقنا عليها اسم CodeFormer، لنمذجة التركيب الشامل والسياق للوجوه ذات الجودة المنخفضة بهدف التنبؤ بالرموز، مما يمكنها من اكتشاف وجوه طبيعية تقترب بشكل كبير من الوجوه المستهدفة حتى عند وجود تدهور شديد في المدخلات. لتعزيز المرونة في التعامل مع أنواع مختلفة من التدهور، نقترح أيضًا وحدة تحويل خصائص قابلة للتحكم تسمح بمرونة بين الدقة والجودة. بفضل القاموس الرمزي السابق المعبر والموديل الشامل، فإن CodeFormer يتفوق على أفضل التقنيات الحالية من حيث الجودة والدقة، ويظهر مقاومة أكبر للتدهور. النتائج التجريبية الواسعة على مجموعات بيانات اصطناعية وحقيقية تؤكد فعالية طريقتنا.