HyperAIHyperAI

Command Palette

Search for a command to run...

LHGNN: شبكات العصبونات الرسومية من الرتبة المحلية الأعلى لتصنيف وتصنيع الوسم للصوت

Shubhr Singh Emmanouil Benetos Huy Phan Dan Stowell

الملخص

لقد أحدثت نماذج الترانسفورمر ثورة في مهام معالجة الصوت، حيث استخدمت آليات الانتباه الذاتي للكشف عن الأنماط والروابط المعقدة داخل بيانات الصوت. ومع ذلك، فإن تركيزها على التفاعلات الثنائية يحد من قدرتها على معالجة العلاقات من الرتب الأعلى التي تعتبر ضرورية لتحديد الأشياء الصوتية المميزة. لمعالجة هذه القصور، يقدم هذا البحث شبكة العصبونات الرسومية المحلية من الرتب الأعلى (LHGNN)، وهي نموذج يستند إلى الرسوم البيانية ويحسن فهم الخصائص من خلال دمج معلومات الجوار المحلي مع البيانات من الرتب الأعلى المستخرجة من مجموعات تجميع C-متوسط الضبابية (Fuzzy C-Means Clusters). وقد أظهر تقييم النموذج على ثلاثة مجموعات بيانات صوتية متاحة للعامة أنه يتفوق على نماذج الترانسفورمر في جميع المقاييس بينما يعمل باستخدام عدد أقل بكثير من المعلمات. علاوة على ذلك، أثبتت LHGNN ميزة واضحة في السيناريوهات التي تفتقر إلى التدريب المسبق باستخدام ImageNet، مما يؤكد فعاليتها وكفاءتها في البيئات التي لا تحتوي على كميات كبيرة من بيانات التدريب المسبقة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
LHGNN: شبكات العصبونات الرسومية من الرتبة المحلية الأعلى لتصنيف وتصنيع الوسم للصوت | مستندات | HyperAI