HyperAIHyperAI
منذ 15 أيام

animal2vec وMeerKAT: تحويلة ذاتية التدريب لبيانات الصوت الخام الحدث النادر وقاعدة بيانات مرجعية كبيرة المقياس للبيوأكستيك

Julian C. Schäfer-Zimmermann, Vlad Demartsev, Baptiste Averly, Kiran Dhanjal-Adams, Mathieu Duteil, Gabriella Gall, Marius Faiß, Lily Johnson-Ulrich, Dan Stowell, Marta B. Manser, Marie A. Roch, Ariana Strandburg-Peshkin
animal2vec وMeerKAT: تحويلة ذاتية التدريب لبيانات الصوت الخام الحدث النادر وقاعدة بيانات مرجعية كبيرة المقياس للبيوأكستيك
الملخص

أبحاث البصمة الصوتية الحيوية، التي تُعدّ حيوية لفهم سلوك الحيوانات والحفاظ عليها والبيئة، تواجه تحديًا ضخمًا يتمثل في تحليل كميات هائلة من البيانات حيث تكون الأصوات الحيوانية نادرة. وعلى الرغم من أن تقنيات التعلم العميق أصبحت قياسية، إلا أن تكييفها لتطبيقات البصمة الصوتية الحيوية ما زال يُعدّ صعبًا. نعالج هذه المشكلة من خلال تقديم نموذج "animal2vec"، وهو نموذج كبير قائم على التحويل (Transformer) قابل للتفسير، إلى جانب خطة تدريب ذاتيّة مصممة خصيصًا للبيانات الصوتية الحيوية النادرة وغير المتوازنة. يتعلم النموذج من بيانات صوتية غير مُعلّمة، ثم يُحسّن فهمه باستخدام بيانات مُعلّمة. علاوةً على ذلك، نقدّم ونُطلق بشكل عام مجموعات بيانات "MeerKAT": نصوص صوتية للنمر الصغير (Suricata suricatta) بتوثيق بدقة جزئية من الميلي ثانية، وهي أكبر مجموعة بيانات مُعلّمة متوفرة حاليًا حول الثدييات البرية غير البشرية. يتفوّق نموذجنا على الطرق الحالية في مجموعة بيانات MeerKAT وفي مجموعة بيانات NIPS4Bplus الصوتية للطيور المُتاحة علنًا. كما يُظهر animal2vec أداءً جيدًا حتى مع كميات محدودة من البيانات المُعلّمة (تعلم قليل العينات). يُقدّم animal2vec وMeerKAT نقطة مرجعية جديدة لأبحاث البصمة الصوتية الحيوية، مما يمكّن الباحثين من تحليل كميات كبيرة من البيانات حتى في ظل نقص معلومات الحقيقة الواقعية (ground truth).

animal2vec وMeerKAT: تحويلة ذاتية التدريب لبيانات الصوت الخام الحدث النادر وقاعدة بيانات مرجعية كبيرة المقياس للبيوأكستيك | أحدث الأوراق البحثية | HyperAI