HyperAIHyperAI

Command Palette

Search for a command to run...

NeRV: تمثيلات عصبية للفيديوهات

Hao Chen Bo He Hanyu Wang Yixuan Ren Ser-Nam Lim Abhinav Shrivastava

الملخص

نُقدّم تمثيلًا عصبيًا جديدًا للفيديوهات (NeRV) يُشَكِّل الفيديوهات باستخدام شبكات عصبية. على عكس التمثيلات التقليدية التي تُعامل الفيديوهات كسلسلة من الإطارات، نُمثّل الفيديوهات كشبكات عصبية تأخذ مؤشر الإطار كمدخل. عند إدخال مؤشر إطار معين، يُخرِج NeRV الصورة RGB المقابلة. تكمن عملية ترميز الفيديو في NeRV في تكييف شبكة عصبية مع إطارات الفيديو، بينما تتم عملية فك الترميز عبر عملية تغذية أمامية بسيطة. وباعتباره تمثيلًا ضمنيًا يُعالج الصورة كوحدة واحدة، يُخرِج NeRV الصورة كاملة، ويُظهر كفاءة كبيرة مقارنة بالتمثيلات ضمنية تعتمد على البكسل، حيث يُحسّن سرعة الترميز بنسبة 25 إلى 70 مرة، وسرعة فك الترميز بنسبة 38 إلى 132 مرة، مع تحقيق جودة فيديو أفضل. وباستخدام هذا التمثيل، يمكننا التعامل مع الفيديوهات كشبكات عصبية، مما يُبسط العديد من المهام المتعلقة بالفيديو. على سبيل المثال، تُعاني الطرق التقليدية لضغط الفيديو من خط أنابيب طويل ومعقد، تم تصميمه خصيصًا لهذه المهمة. في المقابل، باستخدام NeRV، يمكننا استخدام أي طريقة لضغط الشبكات العصبية كمُمَثِّل لضغط الفيديو، وتحقيق أداءً مُComparable مع الطرق التقليدية لضغط الفيديو القائمة على الإطارات (مثل H.264، HEVC، إلخ). إلى جانب الضغط، نُظهِر قدرة NeRV على التعميم في تصفية الضوضاء من الفيديوهات. يمكن العثور على الكود المصدري والنموذج المُدرّب مسبقًا على الرابط التالي: https://github.com/haochen-rye/NeRV.git.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
NeRV: تمثيلات عصبية للفيديوهات | مستندات | HyperAI