HyperAI

باستخدام الشبكات العصبية، يمكن لتوم تتبع جيري في الوقت الحقيقي

منذ 6 أعوام
العصب الحقيقي
神经小兮
特色图像

مجالمن خلال استخدام كمية كبيرة من بيانات الفيديو الحيوانية لتدريب الشبكة العصبية، يمكن تحقيق تقسيم أفضل للحيوانات والخلفية في مراقبة سلوك الحيوان في البيئات المعقدة والديناميكية، وبالتالي تتبع الحيوانات بشكل أفضل.

لماذا تنقر الطيور بيضها أحيانًا؟ ماذا يعني السنجاب عندما يهز ذيله؟ عندما تقوس القطة ظهرها هل يعني هذا أنها خائفة أم غاضبة؟ هل هناك أسرار لهذه المجموعة مخفية وراء سلوكيات الحيوانات المختلفة؟

هل تستطيع تخمين الأفكار الصغيرة للقطط؟

في أقدم العصور، كانت بعض القبائل والمناطق تنظر إلى الحيوانات باعتبارها آلهة، وكان الناس يأملون في الحصول على البشائر والبركات الإلهية من الحيوانات.

ولم تبدأ الأبحاث العلمية حول سلوك الحيوان إلا في القرن العشرين، وكان داروين من أوائل العلماء الذين قاموا بذلك.

ولكن الأبحاث السلوكية المبكرة لم تستطع الاعتماد إلا على الملاحظة البصرية ومسجلات بسيطة.

وفي وقت لاحق، ومع تطبيق التقنيات المتقدمة مثل المراقبة بالفيديو والقياس عن بعد بالراديو، أصبح من الممكن مراقبة سلوك الحيوان وتحديد كميته في الميدان وفي المختبرات التي تحاكي الظروف الطبيعية. يمكن معالجة كميات كبيرة من البيانات بواسطة أجهزة الكمبيوتر الإلكترونية، مما يجعل العلوم السلوكية خاضعة لمعايير كمية.  

وفي السنوات الأخيرة، أعيد استخدام تقنية الذكاء الاصطناعي أيضًا في التقاط "اللغة السلوكية" للحيوانات وتتبعها. 

استخدام أدوات الذكاء الاصطناعي لتتبع تفاصيل حركات أطراف الحيوانات

في الآونة الأخيرة، استخدم باحثون من مختبر جاكسون في الولايات المتحدة بنية شبكة عصبية ملتوية حديثة لتطوير طريقة قابلة للتطوير لتتبع الفئران في المجال المفتوح، وتمكنوا بنجاح من تتبع تحركات الحيوانات وسلوكياتها في بيئات معقدة وديناميكية بدقة تصل إلى مستويات الإنسان.

وتشير التقارير إلى أن الشبكة العصبية التي دربوها قادرة على استخدام أسلوب تعلم بسيط لتتبع الفئران في بيئات مختلفة، بألوان فراء مختلفة، وأشكال أجسام مختلفة، وسلوكيات مختلفة لفترة طويلة، ولا تتطلب العملية إشرافًا بشريًا مستمرًا. 

الإنسان والطبيعة: فهم بعضنا البعض من خلال علم السلوك 

الكون واسع، ووجود الأرض وحيد وثمين. على هذا الكوكب، باستثناء البشر الذين لديهم نظام لغوي كامل، لا تمتلك الحيوانات الأخرى القدرة على اللغة. وهذا يخلق فرقًا وفجوة جوهرية بين البشر والمجموعات العرقية الأخرى.

ينظر الناس في جميع أنحاء العالم إلى الحيوانات المختلفة باعتبارها "رسل الله"
يعتقدون أنهم سيجلبون البركات لأنفسهم

ومع ذلك، فإن سلوك الحيوان هو "لغتهم" بمعنى ما. كل سلوكياتهم لها أساس فسيولوجي معين. ومن خلال مراقبة هذه السلوكيات، يستطيع البشر فهم الظروف الفسيولوجية للحيوانات، وتعبيراتها العاطفية، وسلوكيات التعلم، وما إلى ذلك، مما سيكون له تأثير معين على التخصصات مثل علم النفس والتعليم. 

وعلاوة على ذلك، بالنسبة لصناعة تربية الحيوانات، فإن مراقبة الاستجابات السلوكية للحيوانات في ظل الظروف البيئية المختلفة وفهم أنماط نشاطها يمكن أن يساعد في تحسين إدارة الحيوانات والقدرة الإنتاجية. 

بالنسبة للمختبرات التي تدرس سلوك الذباب والفئران بهدف القضاء على الحيوانات المستهدفة، فإن الفوائد التي تعود على المجتمع ستكون أعظم إذا تمكنت هذه الدراسات من القضاء التام على الآفات التي تنشر الأوبئة والبكتيريا.

إن مراقبة مقاطع الفيديو الخاصة بالحيوانات هي إحدى الوسائل الرئيسية للبحث في مختبرات الحيوانات المختلفة، ولكنها قد تستغرق وقتًا طويلاً وتتطلب جهدًا كبيرًا إذا كان من الضروري وضع علامات على عدد كبير من مقاطع الفيديو يدويًا.

بالنسبة للكمية الكبيرة من بيانات الفيديو التي يتم إنشاؤها من خلال تتبع سلوك الحيوان، يمكن لتقنية الذكاء الاصطناعي أن تحل محل أعمال التتبع والعلامات اليدوية، ويمكنها حتى التتبع بشكل أكثر دقة من البشر.

أداة مفتوحة المصدر تم تطويرها بواسطة فريق في جامعة هارفارد في عام 2018
يمكن لـ "DeepLabCut" تتبع سلوك الحيوانات الصغيرة بدقة وسرعة

قام فريق مختبر جاكسون في الولايات المتحدة بتحليل كميات كبيرة من بيانات مقاطع الفيديو الحيوانية وتدريب الشبكات العصبية على تحليل مقاطع الفيديو الحيوانية وتتبعها وحتى التنبؤ بها تلقائيًا. 

القضاء على الآفات: متتبع الفئران القائم على الشبكة العصبية 

يستخدم مختبر جاكسون أداة تعقب تعتمد على الشبكة العصبية لـيتم تحقيق التتبع التلقائي للفئران دون الحاجة إلى وضع علامات يدويًا على كل إطار من إطارات الفيديو أو وضع علامات على الكائنات البحثية.

قاموا بمقارنة التأثيرات البصرية لثلاثة هياكل مختلفة للشبكة العصبية على فئران مختلفة وظروف بيئية مختلفة. الهندسة المعمارية الأولى هي شبكة تقسيم التشفير والفك، والهندسة المعمارية الثانية هي شبكة تصنيف مجمعة، والهندسة المعمارية الثالثة هي شبكة انحدار. 

أداء هياكل الشبكة التي تم اختبارها أثناء التدريب

تظهر النتائج التجريبية أن شبكة التجزئة العصبية للترميز والفك تتمتع بدقة وسرعة تجزئة عالية مع الحد الأدنى من بيانات التدريب. بالإضافة إلى ذلك، فهي توفر واجهات وسم، وبيانات تدريب وسم، ومعلمات فائقة الدقة، وشبكات مدربة مسبقًا لمجتمعات السلوك وعلم الأعصاب. 

في البحث، من أجل التقاط حركات الحركة الغنية التي يقوم بها الفئران في مقاطع الفيديو، يتم عادةً تلخيص الفئران في نقطة بسيطة، أو مركز كتلة، أو شكل بيضاوي للتحليل. ومن أجل الاستفادة بشكل أفضل من الأساليب الحالية لتتبع الفئران وإجراء التجزئة المناسبة، قام الفريق بتبسيط البيئة التجريبية وحصل على أفضل تباين بين الفئران والخلفية. 

تقوم الشبكة العصبية بتصنيف البكسلات الموجودة في الفيديو والتي تنتمي إلى الفأرة من الخلفية، مما يسمح بتحويل هذه السلوكيات المجردة عالية المستوى إلى بيانات للحسابات الرياضية.

ومن أجل التمييز بين الحيوانات بشكل أفضل، يقوم الباحثون عادة بتغيير لون خلفية المكان وفقا للون فراء الحيوان، ولكن من المرجح أن يؤثر هذا على سلوكه. 

لا تحتاج أدوات التتبع التي تستخدم الشبكات العصبية إلى القيام بذلك. إنه قادر على التتبع بغض النظر عن لون الطلاء في الظروف البيئية المعقدة والديناميكية.

بهذه الطريقة، لا يمكننا إلا أن نقلق بشأن الفأر الصغير جيري. إذا تمكن توم من إتقان هذه التكنولوجيا، فهل سيظل قادرًا على القفز بسعادة؟

التتبع الدقيق: يتطلب تدريبًا مكثفًا

لاختبار بنية الشبكة العصبية، قاموا بتأسيس مجموعة بيانات تدريبية مكونة من 16,234 صورة تدريبية، و568 صورة للتحقق من الثبات. كما قاموا بإنشاء واجهة تصنيف تعتمد على OpenCV لإنشاء بيانات التدريب (الطرق) التي تمكن من إضافة تعليقات توضيحية سريعة للمقدمة والخلفية. 

تم بناء شبكتهم وتدريبها واختبارها في Tensorflow v1.0. تم إجراء معايير التدريب المقدمة على بنية وحدة معالجة الرسوميات Nvidia P100. تم ضبط المعلمات الفائقة عبر عدة تكرارات تدريبية. 

النتيجة النهائية هي أنه من بين البنيات الثلاث المختلفة المذكورة أعلاه، فإن بنية الشبكة المجزأة للمشفر والمفكك قادرة على تحقيق أعلى مستوى من الدقة والوظائف بسرعة عالية (أكثر من 6 أضعاف الوقت الحقيقي).

بالإضافة إلى ذلك، فإنها توفر واجهة توضيحية تسمح للمستخدمين بتدريب شبكة جديدة لبيئتهم المحددة من خلال التعليق على ما لا يقل عن 2500 صورة في حوالي 3 ساعات. 

تتبع الشبكة العصبية يتفوق على الطرق التقليدية 

وبالمقارنة مع طرق التتبع التقليدية، فإن طريقة التتبع عبر الشبكة العصبية التي دربها الفريق "تفوز" في الجانبين التاليين:

1. عدم الاعتماد على التباين البصري بين المقدمة والخلفية

تعمل طرق التتبع التقليدية على التلاعب بالظروف البيئية لزيادة التباين بين الحيوان والخلفية، وبالتالي تحقيق الكشف الصحيح عن المقدمة/الخلفية (التجزئة). ومع ذلك، فإن هذا لا يعالج المشكلة الأساسية المتمثلة في تقسيم الحيوانات ويعتمد على التباين البصري بين المقدمة والخلفية للتتبع الدقيق. لذلك، يجب على الباحثين تقييد البيئة للحصول على أفضل النتائج. 

وهذا يعني أن تقنية تتبع الفيديو هذه لا يمكن استخدامها في بيئات معقدة وديناميكية، أو مع الحيوانات غير المتجانسة وراثيا، وهو ما يجعل إجراء التجارب طويلة الأمد وواسعة النطاق أمرا غير ممكن.     

وللتغلب على المشاكل المذكورة أعلاه، استخدم الفريقالتفافالشبكات، الشبكات العصبية، تحسين جودة التجزئة.بالإضافة إلى ذلك، يتم استخدام تقنيات التجزئة الدلالية لتوفير قدرات التعميم للبيئات الديناميكية التي لا تستطيع عملية طرح الخلفية التقليدية معالجتها.

تتضمن التجربة مقاطع فيديو لفئران ذات خلفيات وراثية مختلفة تؤدي إلى ألوان معاطف مختلفة، بما في ذلك الأسود، والأغوطي، والألبينو، والرمادي، والبني، والعاري، والأبقع.

2. تتبع الفئران في مواقع خاصة

مع انخفاض ملاءمة البيئة للتتبع، يزداد تكرار حالات التتبع السيئة في مقطع فيديو واحد. على سبيل المثال، عندما كانت الفئران حول الزوايا، أو بالقرب من الجدران، أو على أكواب الطعام، كان التتبع غير دقيق للغاية. 

في معظم الحالات، لا يزال التتبع غير الصحيح يحدث بسبب ضعف تقسيم الماوس من الخلفية. يتضمن ذلك نوعين من الأخطاء: أجزاء من الخلفية مقسمة إلى المقدمة (على سبيل المثال، الظلال)؛ ويتم تصنيف الفئران بشكل خاطئ على أنها خلفية عندما تتم إزالة أجزاء من الفأر من المقدمة (على سبيل المثال، فأر مهق يتطابق مع لون الخلفية). 

ولحل هذه المشكلة، استخدم الباحثون مصدر ضوء الأشعة تحت الحمراء لتسجيل تحركات الفئران في ظل ظروف مختلفة من الضوء والظلام في التجربة، واستخدموا شبكة شعاع الأشعة تحت الحمراء لتحديد الموضع الحالي للفئران، وجمعوا 24 ساعة من الفيديو، بما في ذلك الوقت الذي كانت فيه الفئران على كوب الطعام أو في الزاوية. وأخيرًا، قاموا بتحسين بيانات الفيديو وتحليلها.

قام الفريق بمقارنة الشبكة العصبية المدربة مع التعليقات البشرية ووجد أن الشبكة الأولى تفوقت على Ctrax، وهو برنامج رؤية آلية مفتوح المصدر ومتاح مجانًا.

تتبع قابل للتطوير بدرجة عالية باستخدام شبكة عصبية واحدة لتتبع التغيرات البصرية في الفئران أثناء قياس الضغط

وعندما يتم استخدام هذه التقنية على نطاق أوسع، فإنها لن توفر الكثير من الوقت للباحثين فحسب، بل قد تؤدي أيضًا إلى المزيد من الاكتشافات الجديدة، مثل استخدامها لتتبع الحيوانات الصغيرة في بيئات معقدة ورؤية عالم حيواني أكثر وضوحًا وسحرًا.

وفي المستقبل، يمكننا أيضًا استخدام التعلم الآلي للعثور على مصدر الوباء، وفهم احتياجات الحيوانات الأليفة في المنزل، وتتبع تحركات الحيوانات النادرة، وجعل العالم مكانًا أفضل!

انقر لقراءة المقال الأصلي