الانحناء ثلاثي الأبعاد لل.Convolution لتحسين دقة الفيديو

البيانات المكانية الزمنية بين تسلسلات الفيديو ذات أهمية كبيرة في استرجاع الدقة العالية للفيديو (SR). ومع ذلك، لا يمكن لطرق استرجاع الدقة العالية الحالية الاستفادة الكاملة من هذه البيانات المكانية الزمنية، نظرًا لأن استخراج الميزات المكانية ومعالجة الحركة الزمنية يتم عادةً بشكل متسلسل. في هذه الورقة، نقترح شبكة تُسمى D3Dnet (شبكة الت convolution المرن ثلاثية الأبعاد) لدمج المعلومات المكانية الزمنية من كلا البعدين المكاني والزمني في استرجاع دقة الفيديو. وبشكل خاص، نُدخل الت convolution المرن ثلاثي الأبعاد (D3D) لدمج تقنية الت convolution المرن مع الت convolution ثلاثي الأبعاد، مما يُحقق قدرة متفوقة على النمذجة المكانية الزمنية ومرونة في النمذجة المستندة إلى الحركة. أظهرت التجارب الواسعة فعالية D3D في استغلال المعلومات المكانية الزمنية، كما أظهرت النتائج المقارنة أن شبكتنا تحقق أداءً متميزًا على مستوى الحالة الحالية في مجال استرجاع الدقة العالية للفيديو. يمكن الوصول إلى الشيفرة المصدرية من خلال الرابط التالي: https://github.com/XinyiYing/D3Dnet.