منذ 6 أشهر

الملخص

في هذه الورقة، نقدّم نظامنا لاسترجاع المعلومات في مهمة البحث بالاستعلام من خلال مثال صوتي (QUESST)، والذي يتكوّن من نهج النمذجة القائم على "البوستيريورغرا姆" مصحوبًا بخوارزمية التوقيت الديناميكي التسلسلي السريع الموزون (WFS-DTW). وفي هذا العام، ركّزت جهودنا الرئيسية على تطوير نظام مطابقة الكلمات المفتاحية المُعتمد على اللغة، باستخدام جميع المعلومات المتاحة حول اللغات الشفهية، مع مراعاة جميع الاستعلامات وملفات النطق. وعلى الرغم من أن خوارزمية الاسترجاع تبقى هي نفسها التي استخدمناها في العام الماضي، فإن الابتكار الكبير يتمثل في الطريقة التي يتم بها استغلال المعلومات المتعلقة بجميع اللغات المُستخدمة في قاعدة بيانات الاسترجاع. تم تقديم نظامين منخفضي الموارد يعتمدان على نماذج الوحدات الصوتية المُعتمدة على اللغة (AUM). الأول، المسمّى "المُراقب"، يستخدم أربعة فكّين صوتيين مُدرّبين جيدًا، يستندون إلى نماذج صوتية تم تدريبها على بيانات صوتية مُتماشية زمنيًا ومُعلّمة. أما الثاني، المُسمّى "غير المُراقب"، فيعتمد على تقسيم صوتي عشوائي للغة المحددة، حيث يتم استخراج معلومات اللغة الشفهية من قواعد بيانات Mediaeval 2013 وMediaeval 2014. وبالنظر إلى تأثير ذلك على الأداء العام لعملية الاسترجاع، تم دراسة تكييف النموذج الصوتي للغة المحددة من خلال عملية إعادة التدريب في كلا النهجين.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار