كيف تُمكّن التمثيلات العميقة للسمات وتماثل أقليدي من التعرف التلقائي على أوراق النباتات
تُعد تقنية التعرف التلقائي على أوراق النباتات من أبرز تطبيقات الرؤية الحاسوبية والتعلم العميق، حيث تُمكّن من تحديد نوع النبات من خلال صورة لورقته. تعتمد هذه الأنظمة على استخراج ميزات عميقة من الصور باستخدام الشبكات العصبية التلافيفية العميقة (CNN)، وتحويلها إلى تمثيلات عددية مكثفة تُعرف بـ"الإدماجات" (embeddings). تُمثل هذه الإدماجات ميزات حاسمة مثل الشكل، النسيج، نمط الأوردة، وحافة الورقة، مما يُمكّن من مقارنة وتصنيف الأوراق بسهولة. يُبنى النظام على خطوات متسلسلة: اكتشاف الورقة في الصورة، استخراج الإدماج المُدمج، ثم مطابقة هذا الإدماج بقاعدة بيانات من الإدماجات المرجعية باستخدام مقياس التباعد، حيث يُستخدم التباعد الإقليدي كطريقة بسيطة وفعّالة لقياس التشابه في الفضاءات عالية الأبعاد. وعند تطبيع الإدماجات، يُصبح التباعد الإقليدي مرتبطًا إيجابيًا بالتشابه، ما يُمكّن من تطبيق خوارزميات التصنيف القائمة على أقرب جار. تم تطبيق النظام على مجموعة بيانات "أوراق 100 نوع نبات" من مخزن UCI (رخصة CC BY 4.0)، التي تتضمن 1600 صورة عالية الدقة لـ100 نوعًا شائعًا مثل الخشخاش والبلوط، بـ16 صورة لكل نوع. تم تجهيز الصور عبر تكبيرها إلى 224×224 بكسل، وتطبيقات تكبير وانعكاس لتحسين المرونة، وتقسيم البيانات إلى 80% تدريب، و10% تحقق، و10% اختبار. استُخدم نموذج ResNet-50 المُدرّب مسبقًا على ImageNet كمُستخرج للسمات، حيث يُنتج كل صورة إدماجًا 2048 بعدًا من خلال طبقة التجميع المتوسط. تم إزالة الطبقة النهائية للتصنيف، وتم تطبيع الإدماجات باستخدام L2 لضمان مقارنات عادلة. تم بناء قاعدة بيانات من الإدماجات المُنظمة حسب النوع، ثم تم تطبيق خوارزمية التعرف عبر حساب التباعد الإقليدي بين الإدماج المُستخرج من الصورة المُستجوبة والكل الإدماجات المخزنة. عند تجاوز عتبة التباعد (0.68)، يُصنف الورق بنوعه، وإلا يُصنف كـ"غير معروف". أظهرت نتائج التقييم دقة عالية: 96.9% في التصنيف الأول (Top-1)، و99.4% في التصنيف الخامس (Top-5)، مع معدل خطأ إيجابي كاذب 0.8%، وخطأ سالب كاذب 2.3%، ومتوسط زمن استجابة 12 ميلي ثانية لكل صورة على المعالج. تم تحليل الفضاء المُتعلم باستخدام تقنية t-SNE، حيث أظهرت النقاط المُمثلة في 2D تجميعًا واضحًا لكل نوع، مما يدل على قدرة النموذج على التمييز بين الأنواع. كما أظهر تحليل التوزيع التباعدي أن المسافات داخل النوع أقل بكثير من المسافات بين الأنواع، مما يؤكد التمييز القوي. كما سجلت منحنى ROC قيمة AUC تبلغ 0.987، ما يدل على دقة عالية في التمييز، بينما أظهر منحنى الدقة-الاستدعاء (PR) أداءً قويًا حتى عند انخفاض التكرار. يُبرز هذا العمل فعالية نموذج مبني على إدماجات عميقة ومسافات إقليدية في التعرف التلقائي على الأوراق، مع إمكانية تطبيقه في الزراعة الدقيقة، حفظ التنوع البيولوجي، التعليم، والبحث الدوائي. يُعد هذا النموذج مُستقبليًا وقابلًا للتوسيع، ويعمل كأساس مرن لتطبيقات رؤية حاسوبية في البيئة.
