HyperAIHyperAI
منذ 18 أيام

TUKE في MediaEval 2015 QUESST

{Milan Rusko, Jozef Juhár, Matúš Pleva, Martin Lojka, Peter Viszlay, Jozef Vavrek}
TUKE في MediaEval 2015 QUESST
الملخص

في هذه الورقة، نقدّم نظامنا لاسترجاع المعلومات في مهمة البحث بالاستعلام من خلال مثال صوتي (QUESST)، والذي يتكوّن من نهج النمذجة القائم على "البوستيريورغرا姆" مصحوبًا بخوارزمية التوقيت الديناميكي التسلسلي السريع الموزون (WFS-DTW). وفي هذا العام، ركّزت جهودنا الرئيسية على تطوير نظام مطابقة الكلمات المفتاحية المُعتمد على اللغة، باستخدام جميع المعلومات المتاحة حول اللغات الشفهية، مع مراعاة جميع الاستعلامات وملفات النطق. وعلى الرغم من أن خوارزمية الاسترجاع تبقى هي نفسها التي استخدمناها في العام الماضي، فإن الابتكار الكبير يتمثل في الطريقة التي يتم بها استغلال المعلومات المتعلقة بجميع اللغات المُستخدمة في قاعدة بيانات الاسترجاع. تم تقديم نظامين منخفضي الموارد يعتمدان على نماذج الوحدات الصوتية المُعتمدة على اللغة (AUM). الأول، المسمّى "المُراقب"، يستخدم أربعة فكّين صوتيين مُدرّبين جيدًا، يستندون إلى نماذج صوتية تم تدريبها على بيانات صوتية مُتماشية زمنيًا ومُعلّمة. أما الثاني، المُسمّى "غير المُراقب"، فيعتمد على تقسيم صوتي عشوائي للغة المحددة، حيث يتم استخراج معلومات اللغة الشفهية من قواعد بيانات Mediaeval 2013 وMediaeval 2014. وبالنظر إلى تأثير ذلك على الأداء العام لعملية الاسترجاع، تم دراسة تكييف النموذج الصوتي للغة المحددة من خلال عملية إعادة التدريب في كلا النهجين.

TUKE في MediaEval 2015 QUESST | أحدث الأوراق البحثية | HyperAI