HyperAIHyperAI

Command Palette

Search for a command to run...

CASSOD-Net: الهياكل المتسلسلة والمنفصلة للانعكاس المُوسّع لتطبيقات ونُظم الرؤية المدمجة

Tse-Wei Chen Deyu Wang Wei Tao Dongchao Wen Lingxiao Yin Tadayuki Ito Kinya Osa Masami Kato

الملخص

يُعد مجال الرؤية (FOV) للشبكات العصبية التلافيفية مرتبطًا بشكل وثيق بدقة الاستنتاج. وتشتهر التلافيف الممتدة (Dilated Convolutions) بأنها حل فعّال للقضايا التي تتطلب مجالات رؤية كبيرة. ومع ذلك، فإن معالجة التلافيف الممتدة تستغرق عادةً وقتًا إضافيًا مقارنة بالتفعيلات القياسية، سواء على الأجهزة العامة أو الأجهزة المخصصة. في هذا البحث، نقترح وحدة شبكة تُسمى "بنية متسلسلة وقابلة للانفصال للتلافيف الممتدة" (CASSOD)، بالإضافة إلى نظام هاردوير خاص لمعالجة شبكات CASSOD بكفاءة. تتضمن شبكة CASSOD-Net عدة مرشحات ممتدة بحجم 2×22 \times 22×2 مرتبة بشكل متسلسل، والتي يمكن استخدامها بديلًا عن المرشحات الممتدة التقليدية بحجم 3×33 \times 33×3 دون تقليل دقة الاستنتاج. تم اختبار حالتين تطبيقيتين كأمثلة: كشف الوجه والتقسيم الصوري، باستخدام التلافيف الممتدة والوحدات المقترحة CASSOD. وحققت الشبكة الجديدة للكشف عن الوجه دقة أعلى مقارنة بالعمل السابق، مع استخدام فقط 47% من أوزان المرشحات في طبقات التلافيف الممتدة ضمن وحدة السياق. علاوةً على ذلك، يمكن للنظام المُقترح من الأجهزة تسريع عمليات التلافيف الممتدة، حيث يُعد أسرع بنسبة 2.78 مرة مقارنة بأنظمة الأجهزة التقليدية عند استخدام حجم مرشح 3×33 \times 33×3.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp