جيف دين معجب بأبحاث جوجل الجديدة: نموذج الحوت الحيوي الصوتي يمكنه التعرف على 8 أنواع من الحيتان

يعد التعرف على أصوات الحيتان أمرا ذا أهمية كبيرة لحماية البيئة البحرية. يستطيع العلماء تحليل أصوات الحيتان لفهم أنواعها، وطرق هجرتها، وعادات التكاثر، وبنيتها الاجتماعية، وبالتالي صياغة سياسات حماية أكثر فعالية.
ومع ذلك، فإن التعرف على أصوات الحيتان ليس بالمهمة السهلة.أولاً، هناك أكثر من 94 نوعًا معروفًا من الحيتان في العالم، ونطاق التردد الصوتي واسع للغاية، ويتراوح من الموجات الصوتية المنخفضة التي تصل إلى 10 هرتز للحيتان الزرقاء إلى الترددات العالية التي تصل إلى 120 كيلو هرتز للحيتان المسننة. ثانياً، حتى التسجيلات لنفس نوع الحيتان يمكن أن تختلف بشكل كبير عبر الموقع والزمان، مما يزيد من تعقيد تطوير النماذج. وأخيرا، فإن الباحثين لديهم معرفة محدودة للغاية بالخصائص الصوتية لبعض الحيتان النادرة، وبالتالي فإنهم غير قادرين على التمييز بدقة بين أصوات أنواع الحيتان المختلفة.
ولمعالجة هذه المشكلة، قام فريق البحث في جوجل بتطوير نموذج حيوي صوتي جديد للحيتان. يمكن للنموذج التعرف على ثمانية أنواع مختلفة من بين 94 نوعًا معروفًا من الحيتان حاليًا.وتشمل هذه الحيتان الحدباء، والحيتان القاتلة، والحيتان الزرقاء، والحيتان الزعنفية، وحيتان المنك، وحيتان برايد، والحيتان الصحيحة في شمال الأطلسي، والحيتان الصحيحة في شمال المحيط الهادئ. كما قام الباحثون بتوسيع النموذج ليشمل بيوتوانج واستخدموه لتصنيف البيانات من أكثر من 200 ألف ساعة من التسجيلات تحت الماء.
تم نشر البحث ذي الصلة على الموقع الرسمي لـ Google Research تحت عنوان "الصافرات والأغاني والرنات والأصوات الحيوية: التعرف على أصوات الحيتان باستخدام الذكاء الاصطناعي".
أبرز الأبحاث:
* تحديد 8 أنواع مختلفة من 94 حوتًا، بما في ذلك نداءات متعددة لنوعين
* يتضمن صوت بيوتوانج الذي تم تأكيده مؤخرًا على أنه نداء حوت برايد
* يمكن استدعاء النماذج بشكل فردي من خلال واجهة برمجة تطبيقات TensorFlow SavedModel

عنوان الورقة:
يجمع المشروع المفتوح المصدر "awesome-ai4s" أكثر من مائة تفسير ورقي لـ AI4S ويوفر مجموعات وأدوات ضخمة من البيانات:
https://github.com/hyperai/awesome-ai4s
مجموعات البيانات: إنشاء 4 مجموعات بيانات جديدة لمكالمات الحيتان، تغطي 8 من حوالي 94 نوعًا من الحيتان
وبناءً على بيانات التعرف على نداءات الحيتان الموجودة، أنشأ الباحثون أربع مجموعات بيانات جديدة لنداءات الحيتان.وتشمل هذه الأصوات نداءات "البوينغ" التي تطلقها الحيتان المنكية، ونداءات "الرفع" و"الطلق الناري" التي تطلقها الحيتان الصحيحة في شمال المحيط الهادئ، ونداءات الحيتان الزرقاء والحيتان الزعنفية.
صوت "بوينغ" لحوت المنك
لم يتم التعرف على صوت بيوتوانج الغامض، الذي تم تسجيله منذ عقود من الزمن، على أنه صادر عن أي نوع معين من الحيتان.حتى وقت قريب، أشارت أبحاث جديدة من الإدارة الوطنية للمحيطات والغلاف الجوي (NOAA) إلى أن الصوت تم إنتاجه بواسطة حيتان برايد.
وقد تم توثيق أصوات الحيتان المنكية في وقت أقدم من تسجيلات برايد، ويعود تاريخها إلى التسجيلات البحرية في الخمسينيات من القرن العشرين. ولم يتمكن علماء الإدارة الوطنية للمحيطات والغلاف الجوي من نسب هذا الصوت المحدد إلى الحيتان المنك إلا في عام 2005.
ولم تتضمن مجموعة العلامات التي حصل عليها الباحثون في البداية من مركز علوم مصايد الأسماك في جزر المحيط الهادئ (PIFSC) هذا الصوت المعروف باسم "بوينج". لذلك، عندما استخدم باحثو جوجل هذه البيانات للتدريب الأولي للنموذج، حدد النموذج هذا الصوت كنمط غير صحيح. وقام الباحثون بعد ذلك بإجراء دراسات معمقة على هذه الأصوات المكتشفة حديثًا. وفي نهاية المطاف، يمكن التعرف على أصوات الحيتان المنكية بدقة ودمجها في نماذج التعريف المتعددة الأنواع.

نداء "ارتفاع" الحوت الصائب في شمال المحيط الهادئ ونداء "إطلاق النار"
الحوت الصحيح في شمال المحيط الهادئ (NPRW) هو نوع من الحيتان المهددة بالانقراض بشكل كبير وينتشر بشكل رئيسي في مياه شمال المحيط الهادئ. كانت الحيتان الصحيحة في شمال المحيط الهادئ تتعرض في السابق للصيد الجائر حتى كادت أن تنقرض، والآن لم يتبق منها سوى عدد صغير للغاية. يُقدَّر أن تعداد الحيتان الصحيحة في المنطقة الشرقية يبلغ 30 إلى 35 فردًا فقط.
في الوقت نفسه، فإن تعداد الحيتان الصحيحة في شمال المحيط الهادئ هو التعداد الوحيد المعروف للحيتان الصحيحة التي يمكنها "الغناء". في حين أن صوت "النداء المرتفع" يمكن أن يأتي من الحيتان الصحيحة، أو الحيتان المقوسة الرأس، أو حتى الحيتان الحدباء، فإن الحوت الصحيح في شمال المحيط الهادئ يمكن تمييزه من خلال نداء "الرصاص" المميز.


علامات أصوات الحوت الأزرق والحوت الزعنفي
وقال الباحثون إنه قبل تعاونهم الأولي مع مركز علوم مصايد الأسماك في جزر المحيط الهادئ (PIFSC) لتطوير نموذج الحوت الأحدب، كان المركز قد قام بالفعل بشرح بعض بياناتهم، وتحديد وجود الحيتان الزرقاء والحيتان الزعنفية. لا تعيش هذه الحيتان حول جزر هاواي فحسب، بل تنتشر أيضًا على نطاق واسع في المياه المفتوحة لمحيطات العالم.
وفي هذه الدراسة، نظر الباحثون على وجه التحديد إلى البيانات التي تم جمعها بواسطة جهاز MARS الهيدروفوني الذي يديره معهد أبحاث الأحياء المائية في خليج مونتيري (MBARI). ومع ذلك، نظرًا لعدم وجود تسميات أساسية لبيانات MARS، قام الباحثون بتدريب نموذج خصيصًا لتحديد الحيتان الزرقاء والحيتان الزعنفية استنادًا إلى بيانات PIFSC واستخدموها لإنشاء تسميات زائفة لبيانات MBARI.


هندسة النموذج: تصنيف المخططات الطيفية بناءً على الصوت الخام
وأشار الباحثون إلى أن النموذج يقوم أولاً بتحويل البيانات الصوتية الخام إلى بيانات صورة طيفية لتمثيل كل مقطع صوتي مدته 5 ثوان.يستخدم الجزء الأمامي من النموذج محور تردد مقياس ميل، وضغط سعة السجل، ويقوم بالتطبيع عن طريق طرح سعة السجل 5%-ile لكل نطاق تردد. وأخيرًا، قام النموذج بتصنيف الصور إلى أي من أنواع الحيتان الـ12 أو أنواع الأصوات.
بالإضافة إلى ذلك، يمكن استدعاء النموذج بشكل مستقل من خلال واجهة برمجة التطبيقات SavedModel الخاصة بـ TensorFlow.وهذا يعني أنه ليس بإمكاننا استخدام هذا النموذج لتحديد الأنواع والأصوات المضمنة عند تدريب النموذج فحسب، بل يمكننا أيضًا استخدام التضمينات المدربة مسبقًا لهذا النموذج للبحث وتحديد الأصوات الجديدة أو أنواع الحيتان وبناء المصنفات المقابلة بسرعة.
اختبار النموذج: يتمتع النموذج بأداء تمييز جيد لكل فئة
تتطلب المراقبة الصوتية السلبية طويلة الأمد ليس فقط التصنيف الصحيح للأنواع، بل أيضًا الاستبعاد الصحيح للأحداث الصوتية الخلفية وغير الحيوانية. ولذلك، لم يقتصر الباحثون في تدريبهم على التصنيفات الإيجابية، بل قاموا أيضًا باستخراج التصنيفات السلبية والبيانات الخلفية على نطاق واسع من التسجيلات التي قدمتها مؤسسات شريكة أخرى.
للتحقق من صحة النموذج، اختار الباحثون عشوائيًا مجموعة فرعية موحدة من 20% من بيانات التدريب المتاحة كمجموعة اختبار.يوضح الشكل أدناه أداء النموذج على مجموعات الاختبار الخاصة بأنواع مختلفة.
* تشير القيمة العالية لـ AUC (ROC) إلى أن النموذج قادر على التمييز بين العلامات الإيجابية والسلبية بشكل جيد.
* الحساسية عند 0.99 تمثل جزء نتائج تصنيف العلامة الإيجابية الحقيقية التي تسجل أعلى من الحد الذي يستبعد العلامات السلبية الحقيقية لـ 99%.
* الدقة عند 0.5 تمثل نسبة الأنواع المتوقعة بشكل صحيح عند عتبة حساسية معقولة (أقل من 50% من نتائج تصنيف العلامة الإيجابية الحقيقية).

بشكل عام، يمكن للنموذج التعرف بدقة على أي من أنواع الحيتان الثمانية، بما في ذلك الحيتان الحدباء، والحيتان القاتلة، والحيتان الزرقاء، والحيتان الزعنفية، وحيتان المنك، وحيتان برايد، والحيتان الصحيحة في شمال الأطلسي (NARW) والحيتان الصحيحة في شمال المحيط الهادئ (NPRW).بالنسبة لفئات الحيتان مينك وشمال المحيط الهادئ وشمال الأطلسي وبرايد، فإن قيم المقاييس الثلاثة قريبة من 1، مما يدل على الأداء الممتاز للنموذج مع وجود قدر أقل من التنازلات بين العلامات الإيجابية الكاذبة والعلامات السلبية الكاذبة. عندما يتعلق الأمر بتحديد موقع الحيتان القاتلة بالصدى وصافراتها، فإن التناقض أكثر وضوحا.
الجمع بين تقنيات الذكاء الاصطناعي والتعلم الآلي للمساهمة في حماية الحياة البحرية
إن نشر أحدث نتائج أبحاث جوجل له أهمية كبيرة لفهم وحتى تحقيق التواصل بين الأنواع. قال جيف دين، كبير العلماء في جوجل ديب مايند وجوجل ريسيرش، على وسائل التواصل الاجتماعي: "لقد عفا الزمن على برنامج ماجستير اللغة البشرية. يجب أن نكون جميعًا متحمسين لهذا الاختراق!"

قال مدير كبير متخصص في علوم البيانات: "أخيرًا، أستطيع فهم ثرثرة الحيتان في قاع البحر! أتطلع بشوق لرؤية ما إذا كانوا يتحدثون عن أحدث اتجاهات الكريل أم يتجادلون حول أفضل المواقع في قاع البحر!"

ويعتقد بعض مستخدمي الإنترنت أيضًا أن "هذه خطوة مهمة نحو القدرة على التواصل مع الأنواع الأخرى على الأرض، وهي ذات أهمية تاريخية!"

من أجل مساعدة العلماء على فهم كيفية تواصل الحيتان بشكل أفضل، بدأت Google في استكشاف كيفية استخدام تقنيات الذكاء الاصطناعي والتعلم الآلي لتحليل وتحديد أصوات الحيتان في عام 2018، وبالتالي تحقيق الرؤية الجميلة لحماية الأنواع البحرية المهددة بالانقراض والحفاظ على نظام بيئي بحري صحي.
في عام 2018، أقامت Google Research شراكة مع مركز علوم مصايد الأسماك في جزر المحيط الهادئ (PIFSC) التابع للإدارة الوطنية للمحيطات والغلاف الجوي (NOAA)تم تطوير نموذج تصنيف يعتمد على الشبكات العصبية التلافيفية للكشف عن نداءات الحيتان الحدبية، مما أدى إلى إطلاق البحث رسميًا في تصنيف موجات صوت الحيتان.
تم استخدام النموذج لتحديد نداءات الحيتان الحدباء في أكثر من 187000 ساعة من الصوت التي جمعتها الإدارة الوطنية للمحيطات والغلاف الجوي، مما يؤكد الأنماط المكانية الزمنية لأغنية الحيتان الحدباء واكتشاف موقع جديد في شعاب كينجمان حيث لم تتم ملاحظة أصوات الحيتان الحدباء من قبل.
عنوان الورقة:
https://research.google/blog/acoustic-detection-of-humpback-whales-using-a-convolutional-neural-network/
في عام 2019، تعاون الباحثون مع Google Creative Lab لإطلاق أداة تصور تفاعلية تسمى "Pattern Radio" استنادًا إلى هذا النموذج.يعرض هذا البرنامج بيانات صوتية تحت الماء لمدة عام كامل حول الحيتان التي تم جمعها بالقرب من هاواي.
قام النموذج بشرح الصوت، وجاءت بعض البيانات مع رؤى إضافية من الخبراء، مما سمح للباحثين بتحليل الأنماط الصوتية للحيتان بشكل أكثر دقة، وخاصة أغاني الحيتان الحدباء.
عنوان أداة راديو النمط:
https://patternradio.withgoogle.com/
في الواقع، بالإضافة إلى جوجل، كان مركز CETI ملتزمًا أيضًا بأبحاث نداءات الحيتان لفترة طويلة.في مايو/أيار من هذا العام، تعاون مركز CETI مع باحثين من معهد ماساتشوستس للتكنولوجيا لاستخدام التعلم الآلي لتحليل تسجيلات حيتان العنبر، مؤكدين أن الأصوات التي تصدرها حيتان العنبر منظمة وتفصل أبجدية نطق حيتان العنبر، والتي وجد أنها تشبه إلى حد كبير نظام التعبير اللغوي البشري.
ومع استمرار تعمق الأبحاث، قد تصبح طريقة جديدة للتواصل بين الأنواع حقيقة واقعة. ولن يؤدي هذا الاحتمال إلى تغيير فهمنا للحياة البحرية فحسب، بل سيعيد تعريف العلاقة بين البشر والطبيعة أيضًا، مما يبشر بعصر جديد من التعايش المتناغم بين البشر والحيوانات.