Command Palette
Search for a command to run...
اقترحت جامعة كامبريدج وغيرها نموذجًا أساسيًا على مستوى البكسل لمهام مراقبة الأرض، محققة دقة عالية في العديد من المهام.

أصبحت أقمار مراقبة الأرض، القادرة على رصد الأرض على مساحات شاسعة ولفترات طويلة، أدوات بالغة الأهمية في مجالات مثل الإنتاج الزراعي، وإدارة الغابات، والرصد البيئي، وحوكمة الأراضي. وباستخدام بيانات الاستشعار عن بُعد طويلة المدى التي تجمعها الأقمار الصناعية، يستطيع الباحثون تتبع التغيرات الديناميكية على سطح الأرض. مع ذلك، فإن بيانات الرصد الفعلية للأقمار الصناعية ليست مثالية، إذ تشمل عوامل التشويش: الغطاء السحابي، وفترات إعادة زيارة المدار غير المنتظمة، وعدم تطابق دقة المستشعرات، والتشويش في المعدات.ينتج عن ذلك بيانات أولية غير مكتملة وغير متجانسة وغير منظمة، مما يجعل من الصعب استخدامها مباشرة في التحليل الذكي عالي الدقة.وخاصة في السيناريوهات التفصيلية مثل علم الظواهر الزراعية والاضطرابات البيئية قصيرة الأجل، يمكن للغيوم أن تحجب بشكل مباشر عمليات التغيير الرئيسية.
تستخدم الصناعة حاليًا تقنية دمج الصور لإزالة الغيوم وتقليل التشويش، مما ينتج عنه صور موحدة خالية من الغيوم. ورغم أن هذا يحسن جودة البيانات وسهولة استخدامها، إلا أنه يؤدي أيضًا إلى فقدان كبير للمعلومات.غالباً ما تضعف السمات الزمنية الدقيقة مثل الديناميكيات الفينولوجية والتغيرات المفاجئة قصيرة المدى أو حتى تختفي أثناء عملية التركيب، مما يؤدي إلى فقدان بعض المعلومات الرئيسية.
في السنوات الأخيرة، حققت نماذج الاستشعار عن بُعد الأساسية تقدماً ملحوظاً بفضل التدريب المسبق واسع النطاق. مع ذلك، لا تزال معظم النماذج تعتمد على بيانات مثالية خضعت لعمليات ترشيح وتطبيع عميقة، مستخدمةً فقط صوراً اصطناعية خالية من السحب أو بيانات متوسطات السلاسل الزمنية أثناء التدريب. هذا النهج يُهمل فعلياً كمية كبيرة من البيانات الرصدية التي، رغم تأثرها بالغيوم، لا تزال تحتوي على أنماط تغير حقيقية. ونتيجةً لذلك، تواجه النماذج صعوبةً عند التعامل مع بيانات سلاسل زمنية متفرقة وغير مكتملة ومعقدة مغطاة بالغيوم في سيناريوهات تشغيلية فعلية.يؤدي استخلاص الميزات غير المستقر إلى تقليل القدرة على التعميم بشكل كبير.
للتغلب على هذه العقبة، قام فريق بحثي مشترك من جامعة كامبريدج وجامعة آلتو وجامعة بريستول بإنشاء نموذج جديد لتعلم السمات الزمنية يعتمد على خوارزمية بارلو توينز. وبدلاً من تصفية البيانات التي تحتوي على السحب، يقيد هذا النموذج اتساق السمات بين مجموعات فرعية مختلفة من الملاحظات في الموقع نفسه، مما يسمح للنموذج بتعلم التغيرات المكانية والزمانية المستقرة لسطح الأرض بشكل تلقائي، وتكوين تمثيلات سمات الاستشعار عن بعد مع ثبات أخذ العينات الزمني. بناءً على ذلك،واقترح فريق البحث كذلك TESSERA، وهو نموذج أساسي للاستشعار عن بعد على مستوى البكسل لبيانات السلاسل الزمنية متعددة الوسائط Sentinel-1/Sentinel-2.
تم نشر نتائج البحث ذات الصلة، بعنوان "TESSERA: التضمينات الزمنية لأطياف السطح لتمثيل الأرض وتحليلها"، على منصة ما قبل الطباعة arXiv.
أبرز الأبحاث:
* إنشاء تضمينات ميزات على مستوى البكسل وعلى نطاق عالمي مع استخدام عالٍ للعلامات، وتصميم بنية جديدة ذاتية الإشراف، وتدريب نموذج أساسي للاستشعار عن بعد على مستوى البكسل يدمج بيانات Sentinel-1/Sentinel-2 متعددة الوسائط.
* تقديم حل البيانات المضمنة المتوافق مع إرشادات FAIR، وإصدار مجموعة بيانات سنوية عالمية من تضمينات ميزات عددية صحيحة 8 بت بدقة 10 أمتار على مستوى البكسل، مما يوفر موارد استشعار عن بعد متوافقة يمكن نشرها مباشرة.
* أظهرت التجارب أن TESSERA يمكنها تحقيق دقة عالية للغاية مع كفاءة عالية في وضع العلامات في مهام التصنيف والتجزئة والانحدار المتنوعة، وعادة ما تتطلب فقط رأس مهمة خفيف الوزن وحسابًا بسيطًا.

عرض الورقة:
https://hyper.ai/papers/2506.20380
مجموعة البيانات: بناء نظام تقييم متعدد الأبعاد من المستويات العالمية إلى المستويات المحلية
قامت هذه الدراسة بإنشاء نظام بيانات استشعار عن بعد عالمي واسع النطاق يعتمد على السلاسل الزمنية، ويُستخدم في كلٍ من التدريب المسبق للنموذج وتقييم قدرة النظام على التعميم. يتكون نظام البيانات بالكامل من مجموعة بيانات للتدريب المسبق ومجموعة بيانات للتقييم اللاحق.جميع البيانات تستند إلى بيانات الرادار Sentinel-1 والبيانات البصرية Sentinel-2.استغل المزايا التكميلية للرادار والمراقبة البصرية بشكل كامل.

خلال مرحلة التدريب المسبق، قام فريق البحث بإنشاء مجموعة بيانات سلاسل زمنية واسعة النطاق على نطاق عالمي، تمتد من عام 2017 إلى عام 2024، وتشمل مكانيًا أكثر من ثلاثة آلاف بلاطة شبكية في جميع أنحاء العالم.إجمالي عدد العينات حوالي 800 مليون عينة بكسل رقمي.بخلاف العديد من مجموعات البيانات المختارة والموحدة بدقة، تحتفظ هذه المجموعة بأكبر قدر ممكن من الخصائص الأصلية للملاحظات الحقيقية، بما في ذلك البيانات المفقودة، وأخذ العينات غير المنتظم، وغطاء السحب. علاوة على ذلك، تُرفق كل خطوة زمنية بقناع ثنائي لتحديد الحالات الصحيحة للملاحظات، مما يُمكّن النموذج من إدراك البيانات المفقودة والاختلافات في جودة الملاحظات بشكل واضح.
مرحلة التقييم اللاحقة،قام فريق البحث باختيار ست مجموعات بيانات مرجعية متاحة للجمهور، تغطي ثلاث مهام رئيسية: التصنيف، والتجزئة، والانحدار.تغطي منطقة التقييم عدة دول ومناطق، بما في ذلك ألمانيا وفرنسا والنمسا وفنلندا وماليزيا، وتشمل سيناريوهات تطبيقية نموذجية مثل الزراعة والغابات. تتضمن كل مهمة مجموعات بيانات إقليمية واسعة النطاق ومجموعات بيانات محلية مُحسَّنة لتقييم قابلية نقل النموذج عبر المناطق وقدراته على نمذجة الميزات الدقيقة، على التوالي.
علاوة على ذلك، واستجابةً للنقص الحالي في بيانات الشرح متعددة الوسائط عالية الدقة ومتعددة الأوقات من Sentinel-1/2،كما قام فريق البحث بشكل مستقل بوضع معيارين جديدين للتقييم:الأولى هي مجموعة بيانات رسم خرائط المحاصيل على مستوى القطعة النمساوية، والتي تستخدم لتقييم قدرات التصنيف والتجزئة في سيناريوهات الزراعة الدقيقة؛ والثانية هي مجموعة بيانات ارتفاع غطاء الغابات في جنوب شرق آسيا التي تم إنشاؤها بناءً على تصحيح الليدار، والتي تستخدم للتحقق من الأداء في مهام عكس معلمات هيكل الغابات.
نموذج أساسي على مستوى البكسل لمهام رصد الأرض
تم تصميم TESSERA للسماح للنماذج بتعلم تمثيلات مستقرة مباشرة من بيانات السلاسل الزمنية المعقدة وغير المكتملة مع الحفاظ على أكبر قدر ممكن من معلومات الملاحظة الأصلية، وبالتالي تقليل الاعتماد على عمليات إعداد البيانات وإكمالها وإصلاحها.
تحقيقا لهذه الغاية،اقترحت هذه الدراسة لأول مرة طريقة جديدة لتنظيم بيانات السلاسل الزمنية - البكسل-d.يستخدم التحليل التقليدي عادةً صورًا لمشهد واحد أو سلاسل زمنية ثابتة كمدخلات، بينما يركز d-pixel على موقع مكاني واحد، وينظم الملاحظات متعددة المصادر لنفس البكسل التي تم الحصول عليها في أوقات مختلفة في تسلسل ملاحظات بترتيب زمني.لا تحتوي كل بكسل d على معلومات بصرية من Sentinel-2 ومعلومات رادار من Sentinel-1 فحسب، بل تحدد أيضًا الخطوات الزمنية التي تحتوي على عوائق سحابية أو بيانات مفقودة من خلال متجهات القناع.تحافظ طريقة التمثيل هذه بشكل كامل على الخصائص الزمنية لتغيرات السطح. سواء أكانت تغيرات بطيئة ناتجة عن نمو الغطاء النباتي، أو تغيرات مفاجئة قصيرة الأجل ناجمة عن الكوارث والاضطرابات، وما إلى ذلك، فإنه يمكن الحفاظ عليها جميعًا، مما يتجنب بشكل أساسي فقدان المعلومات في عملية التنظيم التقليدية.

فيما يتعلق ببنية النموذج،تستخدم TESSERA مشفرًا مزدوج الفروع لمعالجة البيانات البصرية والرادارية بشكل منفصل.يختلف نوعا البيانات اختلافًا كبيرًا في آليات التصوير والخصائص الفيزيائية. يتيح التشفير المستقل استكشاف خصائص كل منهما بشكل كامل، ومن ثمّ يُمكن دمجهما لتحقيق التكامل متعدد الوسائط. بالنسبة لكل نمط، يُضمّن النموذج أولًا الملاحظات الفعّالة ويُضيف تشفيرًا يوميًا قابلًا للتعلم للموقع خلال السنة لإدخال المعلومات الزمنية. بعد ذلك، يُستخدم مُشفّر Transformer لنمذجة التبعيات الزمنية طويلة المدى. أخيرًا، تُستخدم وحدة تكرارية مُبوبة لتجميع السلسلة الزمنية بأكملها لإنشاء تمثيل أحادي النمط ثابت الأبعاد. بعد دمج خصائص البيانات البصرية والرادارية، يتشكل تمثيل سطحي متعدد الأنماط ذو 128 بُعدًا. تُقدّم الدراسة أيضًا تدريبًا على الإدراك الكمي، حيث يتم ضغط الخصائص النهائية إلى أعداد صحيحة من 8 بت.تم تقليل حجم التخزين بحوالي 75% مع عدم وجود أي فقدان تقريبًا في الدقة.
تُعدّ استراتيجية التدريب المسبق ابتكارًا أساسيًا في نظام TESSERA. فبالاستناد إلى إطار عمل التعلم الذاتي المُشرف عليه لنموذج بارلو التوأمي، يقوم النظام، لنفس البكسل ذي الأبعاد d، باستخراج مجموعتين فرعيتين عشوائيًا من الملاحظات من سلسلته الزمنية الكاملة، وذلك لبناء "وجهتي نظر" مختلفتين. وعلى الرغم من أن مجموعتي الملاحظات تحتويان على نقاط زمنية مختلفة، بل وحتى بعض الخطوات الزمنية مفقودة، إلا أنهما تصفان نفس الجسم السطحي.
أثناء التدريب، يُطلب من النموذج ربط مجموعتي الملاحظات بمساحة ميزات متسقة قدر الإمكان. وبهذه الطريقة،لم يعد النموذج يتعلم السمات الآنية لملاحظة محددة، بل يتعلم أنماط السطح المستقرة الكامنة وراء الملاحظات المختلفة.ينتج عن ذلك تمثيلات مميزة قوية في مواجهة أساليب أخذ العينات الزمنية. علاوة على ذلك، تقدم الدراسة استراتيجية هجينة للتنظيم وإعادة التوزيع الشامل لتعزيز متانة النموذج في مواجهة الاضطرابات الرصدية والارتباط الذاتي المكاني.
تُظهر TESSERA مزاياها في البيانات ذات التصنيف المنخفض والبيانات المتفرقة.
لتقييم أداء نموذج TESSERA بشكل شامل، صممت هذه الدراسة تجربة منهجية تستند إلى سيناريوهات تطبيقية نموذجية في مجال الاستشعار عن بُعد. بدءًا بثلاث مهام - التصنيف، والتجزئة، والانحدار - تحققت التجربة من أداء النموذج في ظل مقاييس بيانات مختلفة، وظروف تصنيف متنوعة، ومشاهد إقليمية متعددة. تم اختيار العديد من نماذج الاستشعار عن بُعد الأساسية الشائعة ونماذج الرؤية الكلاسيكية كخطوط أساس، وتم تحديد ثلاث نسب تصنيف موحدة هي 1% و30% و100%.ينصب التركيز على تقييم القدرة على التعلم في السيناريوهات التي تكون فيها العلامات نادرة.ولضمان العدالة، يتم استخدام محولات خفيفة الوزن للاستدلال اللاحق عبر المهام المختلفة.
في مهام التصنيف، يُظهر نموذج TESSERA تفوقًا ملحوظًا في تعلم الخصائص الزمنية. ويحقق النموذج أداءً رائدًا في كلٍ من تصنيف أنواع الأشجار على المستوى الوطني ومهام تصنيف المحاصيل المُحسّنة.وخاصة في السيناريوهات ذات أحجام العينات المنخفضة للغاية باستخدام بيانات 1% الموسومة فقط، يحافظ برنامج TESSERA على أداء مستقر.تحسّنت دقة التصنيف بنحو 8 نقاط مئوية مقارنةً بالخط الأساسي الأمثل. ويعود هذا التحسّن بشكل رئيسي إلى قدرة النموذج على محاكاة التغيرات السطحية طويلة الأمد بفعالية. فمن خلال استخدام بيانات رصد زمنية كاملة لرصد دورات نمو الغطاء النباتي وخصائصه الفينولوجية، يُمكن تكوين تمثيلات فئوية عالية التمييز حتى مع الحد الأدنى من البيانات المُعلّقة.

أظهر برنامج TESSERA قدرات ممتازة في عرض التفاصيل المكانية في مهام تجزئة الصور. فعند مواجهة مهام تجزئة الأراضي الزراعية واسعة النطاق، حقق النموذج أداءً رائدًا في هذا المجال في ظل ظروف البيانات المصنفة بالكامل؛ وفي سيناريوهات البيانات المصنفة جزئيًا، تفوق أداؤه على جميع النماذج المرجعية. ومن الجدير بالذكر أن...تستطيع TESSERA تعلم معلومات السياق المكاني بفعالية باستخدام وحدة فك تشفير خفيفة الوزن فقط، مع الحفاظ على الدقة وضمان كفاءة النشر في نفس الوقت.في مجموعة بيانات التجزئة الدلالية للمحاصيل النمساوية، يقوم النموذج بإنشاء حدود قطع أكثر وضوحًا، ويقلل بشكل كبير من الارتباك بين المحاصيل المختلفة، ويظهر اتساقًا دلاليًا أقوى بشكل عام.
تُركز مهمة الانحدار بشكل أساسي على اختبار قدرة النموذج على تمثيل معلمات السطح المتصلة. في مهمة تقدير الكتلة الحيوية فوق سطح الأرض، حقق نموذج TESSERA أفضل النتائج عبر مختلف مقاييس التصنيف، مع انخفاض أخطاء التنبؤ وتوزيع مكاني أكثر اتساقًا. وفي مهمة عكس ارتفاع غطاء الغابة، أظهر النموذج قدرته على استخلاص معلومات بنية الغابة ثلاثية الأبعاد، حيث أظهرت نتائج التقدير أعلى توافق مع بيانات قياسات الليدار، مما ساهم في استعادة خصائص البنية الرأسية للغابة بكفاءة.

بناءً على جميع النتائج التجريبية،تحافظ TESSERA على ميزة ثابتة في جميع أنواع المهام الثلاثة: التصنيف والتجزئة والانحدار، وتكون ميزتها أكثر وضوحًا في ظل ظروف معقدة مثل انخفاض مستوى التعليقات التوضيحية والبيانات المتفرقة والملاحظات المفقودة.بالمقارنة مع العديد من النماذج التي تعتمد على بيانات تدريب عالية الجودة، يُظهر نموذج TESSERA تدهورًا تدريجيًا في الأداء في سيناريوهات الاستشعار عن بعد في العالم الحقيقي، مما يدل على قوة أكبر في المتانة والقدرة على التعميم.
الكلمات الأخيرة
هل تتطلب النماذج الأساسية للاستشعار عن بُعد بيانات مثالية حقًا؟ يقدم نهج TESSERA إجابة مختلفة: إذ يسمح للنماذج بالتفاعل المباشر مع سلاسل رصد غير مكتملة وغير منتظمة، وكثيرًا ما تتأثر بالغيوم، من العالم الحقيقي، وتعلم تمثيلات مميزة مع ثبات أخذ العينات في السلاسل الزمنية ضمن إطار عمل ذاتي الإشراف. هذا لا يعني أن تنظيف البيانات لم يعد مهمًا، بل يشير إلى إمكانية تحويل الباحثين تركيزهم من "تنظيف البيانات" إلى "تدريب النماذج على التعامل مع البيانات غير الكاملة". ففي نهاية المطاف، كل صورة قمر صناعي تحتوي على غيوم هي جزء من رصد العالم الحقيقي. ومقارنةً بالسعي الدؤوب وراء بيانات "مثالية" أكثر، قد يكون تمكين النماذج من فهم تعقيدات العالم الحقيقي اتجاهًا حاسمًا لتعميم النماذج الأساسية للاستشعار عن بُعد.








