HyperAIHyperAI
منذ 17 أيام

تمثيلات عصبية ضمنية متعددة الحدود لملفات بيانات كبيرة ومتنوعة

Rajhans Singh, Ankita Shukla, Pavan Turaga
تمثيلات عصبية ضمنية متعددة الحدود لملفات بيانات كبيرة ومتنوعة
الملخص

حصلت التمثيلات العصبية الضمنية (INR) على شهرة كبيرة في تمثيل الإشارات والصور لعدد كبير من المهام النهائية، مثل التكبير الفائق (superresolution) ونمذجة الأبعاد الثلاثة، وغيرها. تعتمد معظم هياكل INR على الترميز المكاني الجيبي (sinusoidal positional encoding)، الذي يُعدّل المعلومات عالية التردد في البيانات. ومع ذلك، فإن الحد المحدود لحجم الترميز يُقيّد قدرة النموذج على التمثيل. ويتطلب الأمر قدرة تمثيلية أعلى للانتقال من تمثيل صورة واحدة معطاة إلى تمثيل مجموعات بيانات كبيرة ومتنوعة. تُعالج طريقة عملنا هذا الفجوة من خلال تمثيل الصورة باستخدام دالة متعددة الحدود، وتحذف الحاجة إلى الترميزات المكانية. وبالتالي، لتحقيق درجة متزايدة من التمثيل متعدد الحدود، نستخدم عمليات الضرب عنصرًا بعنصر بين الميزات والمواضع المنسقة المُحولة بتحويلات خطية (affine-transformed coordinate locations) بعد كل طبقة ReLU. تم تقييم الطريقة المقترحة جوديًا وكميًا على مجموعات بيانات كبيرة مثل ImageNet. ويُظهر نموذج Poly-INR المقترح أداءً مُقارنًا بالنماذج التوليدية الرائدة دون الحاجة إلى طبقات تبديل (convolution)، أو تطبيع (normalization)، أو طبقات الانتباه الذاتي (self-attention)، وبعدد أقل بكثير من المعلمات القابلة للتدريب. وبفضل عدد محدود جدًا من المعلمات التدريبية وقدرة تمثيلية أعلى، تُمهد طريقة عملنا الطريق لاعتماد أوسع للنماذج العصبية الضمنية في مهام التوليد في المجالات المعقدة. يُمكن الوصول إلى الكود من خلال الرابط التالي: \url{https://github.com/Rajhans0/Poly_INR}

تمثيلات عصبية ضمنية متعددة الحدود لملفات بيانات كبيرة ومتنوعة | أحدث الأوراق البحثية | HyperAI