HyperAIHyperAI

Command Palette

Search for a command to run...

تمثيلات عصبية ضمنية متعددة الحدود لملفات بيانات كبيرة ومتنوعة

Rajhans Singh Ankita Shukla Pavan Turaga

الملخص

حصلت التمثيلات العصبية الضمنية (INR) على شهرة كبيرة في تمثيل الإشارات والصور لعدد كبير من المهام النهائية، مثل التكبير الفائق (superresolution) ونمذجة الأبعاد الثلاثة، وغيرها. تعتمد معظم هياكل INR على الترميز المكاني الجيبي (sinusoidal positional encoding)، الذي يُعدّل المعلومات عالية التردد في البيانات. ومع ذلك، فإن الحد المحدود لحجم الترميز يُقيّد قدرة النموذج على التمثيل. ويتطلب الأمر قدرة تمثيلية أعلى للانتقال من تمثيل صورة واحدة معطاة إلى تمثيل مجموعات بيانات كبيرة ومتنوعة. تُعالج طريقة عملنا هذا الفجوة من خلال تمثيل الصورة باستخدام دالة متعددة الحدود، وتحذف الحاجة إلى الترميزات المكانية. وبالتالي، لتحقيق درجة متزايدة من التمثيل متعدد الحدود، نستخدم عمليات الضرب عنصرًا بعنصر بين الميزات والمواضع المنسقة المُحولة بتحويلات خطية (affine-transformed coordinate locations) بعد كل طبقة ReLU. تم تقييم الطريقة المقترحة جوديًا وكميًا على مجموعات بيانات كبيرة مثل ImageNet. ويُظهر نموذج Poly-INR المقترح أداءً مُقارنًا بالنماذج التوليدية الرائدة دون الحاجة إلى طبقات تبديل (convolution)، أو تطبيع (normalization)، أو طبقات الانتباه الذاتي (self-attention)، وبعدد أقل بكثير من المعلمات القابلة للتدريب. وبفضل عدد محدود جدًا من المعلمات التدريبية وقدرة تمثيلية أعلى، تُمهد طريقة عملنا الطريق لاعتماد أوسع للنماذج العصبية الضمنية في مهام التوليد في المجالات المعقدة. يُمكن الوصول إلى الكود من خلال الرابط التالي: \url{https://github.com/Rajhans0/Poly_INR}


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp