ترجمة الصور الفوتوغرافية عالية الدقة في الوقت الحقيقي: شبكة ترجمة الهرم اللابلاسياني

الطرق الحالية لترجمة الصور إلى صور (I2IT) إما مقيدة بالصور ذات الدقة المنخفضة أو تتطلب وقت استدلال طويل بسبب العبء الحسابي الثقيل المترتب على التفاف الخرائط المميزة ذات الدقة العالية. في هذا البحث، نركز على تسريع مهام ترجمة الصور الفوتوغرافية ذات الدقة العالية باستخدام تحليل الهرم اللابلاسي واعادة بنائه بصورة مغلقة. تحديداً، نكشف أن التحولات السماتية، مثل التعديل على الإضاءة والألوان، ترتبط بشكل أكبر بالمكون الترددي المنخفض، بينما يمكن تحسين التفاصيل المحتوية بشكل متكيف على المكونات الترددية العالية. ولذلك، نقترح شبكة ترجمة الهرم اللابلاسي (LPTN) لأداء هذين المهمتين بشكل متزامن، حيث نصمم شبكة خفيفة الوزن لترجمة المكون الترددي المنخفض بدقة مخفضة واستراتيجية قناع تدريجي لتحسين كفاءة المكونات الترددية العالية. يتجنب نموذجنا معظم الحسابات الثقيلة المستهلكة في معالجة الخرائط المميزة ذات الدقة العالية ويحافظ بصدق على تفاصيل الصورة. تظهر النتائج التجريبية الواسعة في مجموعة متنوعة من المهام أن الطريقة المقترحة يمكنها ترجمة صور 4K في الوقت الحقيقي باستخدام بطاقة رسوميات عادية واحدة مع تحقيق أداء تحويل مكافئ للطرق الموجودة. البيانات والرموز متاحة على الرابط التالي: https://github.com/csjliang/LPTN.