فريق MIT/CETI يستخدم التعلم الآلي لعزل أبجدية نطق حوت العنبر! مشابه جدًا لنظام اللغة البشرية، مع قدرة أكبر على حمل المعلومات!

في مجال أبحاث علم البيئة البحرية، تعد العلوم الصوتية الحيوية وسيلة مهمة تمكن الناس من الحصول على معلومات حول الكائنات البحرية.كما يوحي الاسم، تدرس الصوتيات الحيوية بشكل أساسي توليد وانتشار واستقبال الأصوات الحيوانية.مع تطور التكنولوجيا، أصبح الباحثون الآن قادرين على فك تشفير أصوات الحيوانات لفهم نوعها أو جنسها أو هويتها الفردية أو حالتها الصحية.
ومع ذلك، تتطلب تقنيات علم الصوتيات الحيوية التقليدية قدرًا كبيرًا من القوى العاملة لمعالجة وتحليل التسجيلات الميدانية عند إجراء مراقبة السكان، وهو أمر يستغرق وقتًا طويلاً ومكلف. وتقدم الاختراقات التي أحرزتها تقنيات الذكاء الاصطناعي في مجال التعرف على الصوت حلاً مثاليًا لهذا التحدي. لقد حقق التعلم الآلي تقدمًا كبيرًا في مجال الصوتيات الحيوية بسبب قدرته على المعالجة الآلية وقدرات التعلم الذاتي.
اليوم، وصل تحليل التعلم الآلي لأصوات الحياة البحرية إلى مرحلة التطبيق الناضج. من بين جميع الكائنات البحرية، تمتلك الحيتانيات مثل الحيتان والدلافين خصائص سلوكية اجتماعية وتعاونية معقدة، وهي تشبه إلى حد كبير المجتمع البشري ولها قيمة بحثية عالية للغاية.
ومن بين هذه الكائنات، أصبحت حيتان العنبر محور الأبحاث بسبب نظامها اللغوي الذي يشبه إلى حد كبير نظام المجتمع البشري.
باعتبارها من الثدييات الاجتماعية للغاية، تعيش حيتان العنبر في عائلات ولها بنية اجتماعية معقدة.لاتخاذ قرارات جماعية، فإنهم يتواصلون في معظم الأوقات عن طريق إصدار أصوات "نقر" متواصلة، والتي يمكن أن تستمر لمدة 10 ثوانٍ فقط أو لمدة تصل إلى نصف ساعة. ورغم أن نظام اتصالاتهم يبدو بسيطا، إلا أنه قادر على تحقيق سلسلة من السلوكيات المعقدة المنسقة. لقد أصبح التناقض بين الاثنين "لغزًا" يريد الباحثون حله. وقد أثبت عدد كبير من الدراسات السابقة مدى تعقيد أصوات حيتان العنبر، لكن الخصائص المحددة وبنية مقاطعها الصوتية لا تزال غير معروفة.
ولتحقيق هذه الغاية، استخدمت براتيوشا شارما من معهد ماساتشوستس للتكنولوجيا وباحثون من مركز CETI التعلم الآلي لتحليل تسجيلات حيتان العنبر.وقد تم التأكيد على أن الأصوات التي تصدرها حيتان العنبر تتكون وتتشكل من خلال مجموعة من السمات المختلفة. تم أيضًا فصل أبجدية نطق حوت العنبر من خلال تقنية التعلم الآلي، وتبين أن نظام التعبير اللغوي الخاص به يشبه إلى حد كبير نظام التعبير اللغوي لدى البشر ولديه قدرة أكبر على حمل المعلومات.
نُشر البحث ذو الصلة في مجلة Nature Communications تحت عنوان "البنية السياقية والتوليفية في أصوات حيتان العنبر".
أبرز الأبحاث:
* استخدمت هذه الدراسة بيانات من مشروع حيتان العنبر في دومينيكا (DSWP)، وهو أكبر قاعدة بيانات متاحة لحيتان العنبر، لتحليل 8719 سجلاً من حوالي 60 حوتًا من نوع حيتان العنبر المختلفة من مجتمع حيتان العنبر في شرق البحر الكاريبي، وحددت "أبجدية صوتية لحيتان العنبر".
* لغة حوت العنبر تركيبية، أي أنها قادرة على الجمع بين "النقرات" والإيقاعات المختلفة وتعديلها لإنشاء أصوات معقدة تشبه إلى حد كبير لغة الإنسان

عنوان الورقة:
https://www.nature.com/articles/s41467-024-47221-8
يجمع المشروع المفتوح المصدر "awesome-ai4s" أكثر من مائة تفسير ورقي لـ AI4S ويوفر مجموعات وأدوات ضخمة من البيانات:
https://github.com/hyperai/awesome-ai4s
مجموعة البيانات: كمية كبيرة من البيانات وفترة زمنية طويلة
تأتي مجموعة البيانات المستخدمة في هذه الدراسة من مشروع حيتان العنبر في دومينيكا (DSWP)، وهو حاليًا أكبر مستودع لبيانات حيتان العنبر.استخدم الباحثون تسجيلات من 60 حوتًا منويًا مختلفًا من فرع حوت العنبر 1 في شرق البحر الكاريبي (EC-1) في تحليلهم، والذي تضمن ما مجموعه 8719 بيانات استيقاظ.
ومن الجدير بالذكر أن مجموعة البيانات لا تحتوي فقط على بيانات الذيل الموضحة يدويًا من منصات وأنظمة تسجيل مختلفة بين عامي 2005 و2018؛ ويشمل أيضًا البيانات المسجلة من أجهزة الاستشعار (DTags) المرفقة بالحيتان العنبر بين عامي 2014 و2018.
تتميز أعقاب حوت العنبر بمزيج غني من الميزات
ولمراقبة التغيرات في نهايات التواصل لدى حيتان العنبر والاتجاهات طويلة الأمد بشكل واضح، استخدم الباحثون أسلوب التصور لوصف هذه الأصوات. كما هو موضح في الشكل أدناه: يوضح الشكل (أ) مخطط صوت الذيل للتواصل بين حوتين خلال دقيقتين في مجموعة بيانات DSWP، ويتم تمثيل أصوات الذيل المنبعثة من الحيتان باللون الأزرق والبرتقالي على التوالي.

وبعد ذلك، قام الباحثون بإسقاط هذه الاستيقاظات على مخطط زمني لمراقبة التغيرات في استيقاظات حوت العنبر على مدى فترة دقيقتين. كما هو موضح في الشكل ب والشكل ج، يمثل المحور الأفقي الوقت منذ أن بدأت حيتان العنبر في التواصل، ويمثل المحور الرأسي الوقت منذ نهاية التواصل. وفي الشكل ج، قام الباحثون أيضًا بربط النقرات المتطابقة بين الكودات المتجاورة. يمكن ملاحظة أنه أثناء الاتصال، تتغير المقاطع الختامية بسلاسة في المدة وتظهر نقرات إضافية، مما يكشف عن تغييرات معقدة وسياقية في بنية المقاطع الختامية، مما يشير إلى أن حيتان العنبر لديها قدرة أكبر على حمل المعلومات مما تم الإبلاغ عنه سابقًا في الدراسات.
في السابق، كان يُعتقد أن حيتان العنبر لديها 21 نوعًا منفصلًا من أصوات الذيل. أظهرت هذه الدراسة أنتتكون أنواع الكودا المختلفة من ميزتين مستقلتين عن السياق (الإيقاع والإيقاع) وميزتين تعتمدان على السياق (الروباتو والزخرفة).
وكما هو موضح في الشكل أدناه، أطلق الباحثون على خصائص صوت الذيل الموزعة في مجموعة محدودة من الأنماط خلال المدة اسم الإيقاع. ومن بينها، تكشف الصورة اليسرى أن المدة الإجمالية لصوت ذيل حوت العنبر هي مجموع فترات نقراته؛ الصورة اليمنى تظهر التغيرات في أصوات الذيل لأنواع الإيقاع المختلفة.

في الشكل B، قام الباحثون بتطبيع متجه ICI حسب المدة الإجمالية للحصول على تمثيل كودا مستقل عن المدة وأطلقوا عليه اسم الإيقاع.

في الشكل ج، أطلق الباحثون على التعديل البطيء الذي يقوم به حوت العنبر لمدى سلسلة من الاستيقاظات اسم "روباتو"، ولاحظوا أن "روباتو" تدريجي، أي أن الاستيقاظات المتجاورة في تواصل حوت العنبر تكون أقرب في المدة من الاستيقاظات المماثلة في أماكن أخرى.

في الشكل د، قام الباحثون بتعريف النقرة الأخيرة في أعقاب حوت العنبر على أنها زينة. لا يتم توزيع الزخارف بشكل عشوائي، بل تظهر في أماكن محددة في التبادلات الأطول.
توصلت الدراسة إلى أن (1) في تسلسل نداء حوت واحد، تكون نسبة تسلسل صوت الزخرفة الذي يظهر في بداية تسلسل النداء أعلى بشكل ملحوظ من نسبة التسلسل بدون صوت الزخرفة؛ (2) نسبة تسلسل صوت الزخرفة الذي يظهر في نهاية تسلسل النداء أعلى بشكل ملحوظ أيضًا من نسبة التسلسل بدون صوت الزخرفة.

وأشار الباحثون إلى أن هذه السمات الأربع يمكن استشعارها والتصرف بناءً عليها من قبل الحيتان التي تشارك في التواصل الصوتي، وبالتالي فإنها تشكل مكونًا واعيًا لنظام التواصل لدى الحوت.يمكن الجمع بين الإيقاع والمقياس والارتعاش والزخرفة بحرية، مما يسمح للحيتان بتوليف عدد كبير من الكودات المميزة بشكل منهجي.
نتائج البحث: أبجدية نطق حوت العنبر تشبه إلى حد كبير ذخيرة اللغة البشرية
من خلال التحليل البصري أعلاه،استخدم الباحثون التعلم الآلي لعزل أبجدية نطق حوت العنبر، والتي تشبه إلى حد كبير مكتبة اللغة البشرية.كما هو موضح في الشكل التالي:

يمثل المحور الأفقي نوع إيقاع الكودا، ويمثل المحور الرأسي نوع إيقاع الكودا، ويمثل لون كل خلية عدد المرات التي يظهر فيها مزيج الإيقاع/الإيقاع في مجموعة بيانات DSWP. توفر المخططات الدائرية في كل خلية معلومات حول مدى استخدام التريمولو والزخارف معًا في الكودات لكل مجموعة من الميزات: يوضح المخطط الدائري على اليسار نسبة الكودات التي تحتوي على تريمولو إلى الكودات التي لا تحتوي على تريمولو، بينما يوضح المخطط الدائري على اليمين نسبة جميع الزخارف التي تظهر في مجموعة الميزات تلك.
وأشار الباحثون إلى أنه على الرغم من عدم دمج جميع سمات الذيل،ومع ذلك، فإن أعقاب حوت العنبر لديها بنية تركيبية غنية بمعلمات منفصلة ومتصلة، والتي يظهر منها على الأقل 143 تركيبة بشكل متكرر في تركيبة في أعقابها، وهو ما يتجاوز بكثير أنواع الاستيقاظ المنفصلة البالغ عددها 21 والتي تم تحديدها سابقًا.
مشروع CETI: مخصص لاستخدام التعلم الآلي لتمكين المحادثات بين الأنواع
تتمتع منظمة CETI، التي تتعاون مع معهد ماساتشوستس للتكنولوجيا هذه المرة، بصوت عالٍ في دراسة استيقاظ حيتان العنبر. CETI هي منظمة غير ربحية تستخدم التعلم الآلي المتقدم والروبوتات للاستماع إلى اتصالات حيتان العنبر وترجمتها.تأسست المنظمة في عام 2020 بهدف حماية أعداد حيتان العنبر بشكل فعال من خلال فهم وترجمة نظام اتصالاتها.
يتألف فريق CETI من خبراء عالميين رائدين في مجال الذكاء الاصطناعي ومعالجة اللغة الطبيعية، وخبراء التشفير، واللغويين، وعلماء الأحياء البحرية، وخبراء الروبوتات، وخبراء الصوتيات تحت الماء من جامعات مختلفة. يركز الفريق بشكل أساسي على جمهورية الدومينيكان في شرق البحر الكاريبي، وستكون جميع الأبحاث والنتائج مفتوحة المصدر.
بالإضافة إلى أبجدية نطق حوت العنبر المذكورة أعلاه، أجرى الفريق العديد من الدراسات الأخرى حول نطق حوت العنبر.
في 29 أغسطس 2019، نشر مركز CETI نتيجة بحث بعنوان "تقنيات التعلم الآلي العميق للكشف عن وتصنيف الصوتيات الحيوية لحوت العنبر" في التقارير العلمية.لقد أثبتنا جدوى تطبيق تقنيات التعلم الآلي على الصوتيات الحيوية لحيتان العنبر، وثبتنا فعالية بناء الشبكات العصبية لتعلم التمثيلات ذات المغزى لأصوات الحيتان.
عنوان الورقة:
https://www.nature.com/articles/s41598-019-48909-4
في 17 يونيو 2022، نشر مركز CETI مقالاً بعنوان "نحو فهم التواصل لدى حيتان العنبر" في مجلة IScience، مع التركيز على أساليب تسجيل وتحليل التواصل لدى حيتان العنبر، بما في ذلك الخطوات الرئيسية التالية:
التسجيل: مجموعة بيانات طولية متعددة الوسائط واسعة النطاق لبيانات اتصالات الحيتان وسلوكها تم جمعها من مجموعة متنوعة من أجهزة الاستشعار؛
المعالجة: تنسيق ومعالجة بيانات أجهزة الاستشعار المتعددة؛
فك التشفير: باستخدام تقنيات التعلم الآلي، نقوم بإنشاء نماذج للتواصل بين الحيتان، وتوصيف بنيتها، وربطها بالسلوك؛
التشفير وإعادة التشغيل: إجراء تجارب تشغيل تفاعلية وتحسين نموذج لغة الحوت.

عنوان الورقة:
https://www.sciencedirect.com/science/article/pii/S2589004222006642
4 ديسمبر 2023استخدمت CETI التعلم الآلي لاكتشاف حروف العلة والحروف المزدوجة في الكودات الخاصة بحيتان العنبر، وأن كلا الكوداتين يمكن أن تظهر في أنواع كودات تقليدية مختلفة..
في 24 مارس 2024، اكتشف فريق الباحثين أن حيتان العنبر تصدر سلسلة من الأصوات النقرية الاندفاعية، والتي تشبه النقرات، عندما تبحر تحت الماء، وأطلقوا عليها اسم نقرات تحديد الموقع بالصدى. وقد اكتشفوا أيضًا وجود نقرات صدى تحديد الموقع لحيتان العنبر في بيئة صاخبة.
باعتباره حيوان ثديي شديد الذكاء، فقد ثبت أن نظام اللغة لدى حوت العنبر يشبه إلى حد كبير نظام اللغة لدى البشر. في عصر التطور السريع لتكنولوجيا التعلم الآلي، ينضم المزيد والمزيد من المتخصصين إلى مشروع البحث في نطق حوت العنبر. ومع استمرار تعميق الأبحاث، من المتوقع أن يصبح الحوار بين الإنسان والحيتان حقيقة واقعة.
مراجع:
1.https://www.projectceti.org/news-research-insights#publications