أفضل من النماذج الخمسة المتقدمة، نموذج GNNWLR الذي اقترحه فريق Du Zhenhong في جامعة Zhejiang: تحسين دقة التنبؤ بالتعدين

فازت قطر بحق استضافة كأس العالم في عام 2010، وتم تنظيمها بنجاح في عام 2022، باستثمارات إجمالية بلغت نحو 229 مليار دولار أميركي. وبالمقارنة، فإن التكلفة الإجمالية لبطولات كأس العالم السبع السابقة لم تتجاوز نحو 40 مليار دولار. ويعرض هذا الحدث الرياضي أسلوبًا باهظًا، ينبع في نهاية المطاف من التراث العميق لدولة قطر. كما يقول المثل، "إذا كان لديك منجم في المنزل، فلن يكون لديك أي قلق". بفضل مواردها المعدنية الغنية، تتمكن قطر من إنفاق الأموال بحرية وإنشاء سلسلة من الفعاليات السمعية والبصرية.
بالنسبة للأفراد، فإن الموارد المعدنية تعني ثروة لا تنضب، وهو أمر رائع؛ بالنسبة للمجتمع، فهي ركيزة مهمة للتنمية الاقتصادية والاجتماعية، وترتبط بالاقتصاد الوطني ومعيشة الشعب والأمن الوطني. ومع ذلك، فإن الموارد المعدنية ليست متاحة بسهولة. إنها مختبئة على عمق مئات الأمتار تحت الأرض، وغالبًا ما يتطلب الأمر الكثير من العمل الشاق لاستكشاف الموارد المعدنية القيمة.
مع التطور المستمر لاستكشاف المعادن، شكلت الصناعة تدريجيا طريق بحث موجه بـ "نظام تشكيل الخام - نظام الاستكشاف - نظام التنبؤ والتقييم". على الرغم من أن الذكاء الاصطناعي يلعب دورًا متزايد الأهمية في أنظمة التنبؤ بالموارد المعدنية وتقييمها (MPM)، إلا أن تطبيقه لا يزال يعاني من بعض القيود، مما يجعل من الصعب في كثير من الأحيان على الجيولوجيين الثقة في النتائج النهائية.
من أجل تحسين إمكانية تفسير نماذج التنبؤ بالتعدين وعدم الثبات المكاني الناجم عن العوامل الجيولوجية في عملية التعدين،اقترح فريق بحثي من جامعة تشجيانغ طريقة جديدة للذكاء الاصطناعي الجغرافي المكاني - الانحدار اللوجستي المرجح بالشبكة العصبية الجغرافية (GNNWLR).
يدمج النموذج الأنماط المكانية والشبكات العصبية، وعند دمجه مع نظرية التفسير الإضافي لشابلي، فإنه لا يمكنه تحسين دقة التوقعات بشكل كبير فحسب، بل يمكنه أيضًا تحسين إمكانية تفسير التنبؤات المعدنية في السيناريوهات المكانية المعقدة.

أبرز ما جاء في البحث
* تم اقتراح نموذج الانحدار اللوجستي المرجح للشبكة العصبية الجغرافية GNNWLR
* يتفوق GNNWLR على النماذج المتقدمة الأخرى في التنبؤ بالموارد المعدنية وتقييمها
* يتغلب GNNWLR على التباين المكاني والتأثيرات غير الخطية
* GNNWLR يحسن قابلية تفسير الذكاء الاصطناعي لآليات التمعدن

عنوان الورقة:
https://doi.org/10.1016/j.jag.2024.103746
اتبع الحساب الرسمي وأجب "تنبؤ تشكيل الخام" للحصول على ملف PDF الكامل
التنافس على موقع اختبار MPM العالمي: ميجوما، نوفا سكوشا، كندا
ركزت الدراسة على مجموعة ميجوما، وهي منطقة تبلغ مساحتها نحو 7800 كيلومتر مربع في غرب نوفا سكوشا في كندا، وتغطيها بشكل أساسي الأراضي العشبية والغابات. تتكون منطقة ميجوما من تشكيلين، الأول هو تشكيل مجموعة جولدنفيل، والذي يتكون بشكل أساسي من الحجر الرملي المتحول. الطبقة العليا هي تكوين مجموعة هاليفاكس، والتي تتكون من صخور الصخر الزيتي المعقدة.
نتيجة لتكوين جبال أكاديا ووضع الجرانيت الديفوني، تشكلت سلسلة من هياكل الطيات المتجهة من الشمال الشرقي إلى الجنوب الغربي في المنطقة، والتي أصبحت أرض اختبار لمجموعة متنوعة من أنظمة التنبؤ بالموارد المعدنية وتقييمها.

توجد 20 رواسب ذهبية توربيديتية في منطقة الدراسة. لذلك،استخدمت الدراسة ست طبقات مميزة، بما في ذلك عوامل البنية المضادة للتجاعيد، وعوامل الاتصال بين تكويني جولدنفيل وهاليفاكس، والعناصر الكيميائية مثل النحاس (Cu)، والرصاص (Pb)، والزرنيخ (As)، والزنك (Zn).
أجرت الدراسة تحليلًا للحلقات العازلة المتعددة على الطية المضادة وسطح التلامس بين تكويني جولدنفيل وهاليفاكس، مع تعيين الأوزان المقابلة على فترات 0.5 كم، لتشكيل ما مجموعه 16 حلقة عازلة. وفي الوقت نفسه، أجرت الدراسة أيضًا استيفاءً مرجحًا للمسافة العكسية (IDW) على 671 عينة من رواسب البحيرة التي تحتوي على عناصر كيميائية. وأخيرًا، قامت الدراسة بتقسيم منطقة الدراسة بأكملها إلى شبكة وتوحيد جميع طبقات المعالم في بيانات شبكة 1 كم × 1 كم.
وبما أن عدد العينات الإيجابية البالغ 20 عينة لا يزال صغيرا للغاية مقارنة بمنطقة الدراسة بأكملها، فمن المرجح أن تكون نسبة العينات الإيجابية والسلبية غير متوازنة. لذلك، قامت هذه الدراسة أيضًا بتحليل المنطقة العازلة، وتقسيم دائرة نصف قطرها 2 كم حول نقاط العينة الإيجابية العشرين، ثم أجرت تحليلًا نقطيًا.
وفي نهاية المطاف، أسفرت الدراسة عن 245 عينة إيجابية، مما يشير إلى وجود رواسب معدنية، والباقي أشار إلى عدم وجودها. وفي الوقت نفسه، قامت الدراسة باختيار نفس كمية البيانات بشكل عشوائي مثل العينات الإيجابية من مجموعة العينات السلبية ودمجها مع العينات الإيجابية لإنشاء مجموعة تدريب ومجموعة تحقق.
نموذج GNNWR: مجموعة فعالة من الشبكات العصبية
نظرًا لأن بنية نموذج الانحدار المرجح للشبكة العصبية الجغرافية (GNNWR) تستخدم خطأ مربع المتوسط، فإن تطبيقها مباشرة على التنبؤ بالموارد المعدنية وتقييمها قد يؤدي إلى تحديات التقارب. أظهرت الأبحاث أن الإنتروبيا المتقاطعة لها مزايا عملية أكثر من خطأ المربع المتوسط. لذلك،استخدمت الدراسة دالة خسارة مصممة خصيصًا للانحدار اللوجستي - الانتروبيا المتبادلة الثنائية (BCE).
في هذا السياق، يقوم GNNWLR أولاً بحساب المسافة بين الإحداثيات المكانية لكل نقطة بيانات والإحداثيات المكانية لنقاط البيانات الأخرى في مجموعة بيانات التدريب، ويستخدم هذا كمدخل لإجراء تسوية الانقطاع ومنع الإفراط في التجهيز.
ثانياً، قامت الدراسة بإجراء عملية ضرب نقطي على مخرجات متجه الوزن المكاني بواسطة الشبكة العصبية، والمعاملات التي تم الحصول عليها بطريقة المربعات الصغرى، وقيم المتغيرات المستقلة، ثم طبقت دالة الانحدار اللوجستي لتوليد قيمة التنبؤ النهائية.
وأخيرًا، استخدمت الدراسة دالة خسارة الإنتروبيا المتقاطعة الثنائية لحساب الخسارة بالنسبة للقيمة الفعلية واستخدمتها لتوجيه الشبكة العصبية لإجراء تعديلات التغذية الراجعة السلبية.

وفي هذه الدراسة، قارن الباحثون أيضًا بين النماذج الأكثر شيوعًا للانحدار الموزون جغرافيًا (GWR)، وآلة الدعم المتجهي (SVM)، والغابات العشوائية (RF)، والانحدار اللوجستي الموزون جغرافيًا (GWLR)، وانحدار متجه الدعم الموزون جغرافيًا (GWSVR)، والغابات العشوائية (GWRF).
على وجه التحديد، استخدمت هذه الدراسة التحقق المتبادل الخماسي لتقسيم الرواسب العشرين عشوائيًا إلى 5 تسلسلات، كل منها يحتوي على 4 رواسب، ثم أجريت تحليلًا عازلًا على هذه الرواسب الأربعة بنصف قطر عازل يبلغ 2 كم للحصول على عينات إيجابية لكل تسلسل. وبالمثل، قامت هذه الدراسة أيضًا باختيار عينات سلبية بشكل عشوائي من مجموعة العينات السلبية عن طريق مطابقة عدد العينات الإيجابية، وظهرت كل عينة سلبية مرة واحدة فقط في التحقق المتبادل الخماسي.
وفقًا لنظرية التحقق المتبادل الخماسي، يتم استخدام أربع مجموعات عينات للتدريب ويتم استخدام مجموعة عينات واحدة للتحقق. يتم تكرار هذه العملية خمس مرات، حيث يعمل كل تسلسل كمجموعة للتحقق من الصحة. أخيرًا، يتم دمج مجموعة التدريب ومجموعة التحقق التي تم الحصول عليها من خلال التحقق المتبادل الخماسي.
ومن النتائج،بفضل التكامل الفعال للشبكات العصبية في نموذج GNNWLR، يتفوق GNNWLR بشكل كبير على النماذج الأخرى ويظهر قدرات ممتازة في التركيب والتنبؤ في تصنيف المعادن، مع AUC بقيمة 0.913، وهو أعلى بمقدار 5%-16% من النماذج الأخرى.وفي الوقت نفسه، فإن GWRF وGWSVR أفضل بكثير من RF وSVM، وقد يكون ذلك بسبب دمجهما مع الانحدار المرجح جغرافيًا (GWR)، والذي يمكنه وصف العلاقة المحلية بين المتغيرات المكانية بدقة أكبر.

كما تظهر خرائط MPM لجميع النماذج بصريًا أن هناك تباينًا مكانيًا كبيرًا في احتمالات وجود المعادن في نوفا سكوشا، مع حصول المنطقة الشمالية الشرقية على درجة أعلى بشكل عام، بما يتفق مع الموقع الفعلي للرواسب. لكن،في مواجهة موارد الذهب البعيدة عن المناطق المركزة، يمكن لـ GNNWLR اكتشاف المزيد من الرواسب التي يتم تجاهلها بسهولة بواسطة نماذج أخرى.
على سبيل المثال، تصل درجة GNNWLR في "المنطقة 1" إلى 0.985، في حين أن الدرجات المقابلة لنماذج GWSVR وGWRF وGWLR وSVM وRF وGWR هي 0.288 و0.438 و0.471 و0.133 و0.383 و0.290 فقط.

بالإضافة إلى ذلك، تظهر نماذج RF وSVM قفزات مفاجئة في "المنطقة 2" و"المنطقة 3"، مما يؤثر على دقتها وموثوقيتها. تأخذ نماذج GNNWLR وGWLR وGWR في الاعتبار القرب المكاني وتباين عوامل التمعدن، مما قد يمنع حدوث الطفرات الشائعة في نماذج التعلم الآلي التقليدية. وقد لوحظ أن GNNWLR يظهر قدرة متفوقة في التقاط العلاقات غير الخطية المعقدة بين هذه العوامل، وخاصة تلك المتعلقة بالاختلافات المكانية.
لذلك،يظهر GNNWLR انتقالًا سلسًا نسبيًا في التنبؤ باحتمالات المعادن، حيث يظهر دقة أعلى وتناسقًا مع البيانات التجريبية.
يمكن لـ SHAP تحليل العوامل المؤثرة على التمعدن بشكل كمي
لتحسين إمكانية تفسير تقييم النموذج، قامت هذه الدراسة بدمج واستخدام مجموعة العينة الإيجابية من مجموعة البيانات بأكملها لحساب خصائص احتمالات المعادن في المواقع ذات الصلة في GNNWLR.
وتظهر النتائج أن As له التأثير الأكبر على مخرجات النموذج ويرتبط بشكل إيجابي بقيمة SHAP. كلما كانت قيمة As أكبر، كلما كانت قيمة SHAP أعلى وكلما زادت إمكانية التمعدن. قد يكون السبب في ذلك هو أن الزرنيخ هو عنصر حراري مائي منخفض الحرارة ويرتبط غالبًا برواسب الذهب. وعلى نحو مماثل، كان للزنك تأثير سلبي على العديد من مناطق التعدين، في حين كان للنحاس التأثير الأقل أهمية. ومن بينها، يعتبر الزرنيخ والرصاص من العناصر الحرارية المائية منخفضة الحرارة المرتبطة بالمعادن مثل الريلجار والجالينا، في حين يعتبر الزنك والنحاس من العناصر الحرارية المائية متوسطة الحرارة التي تشكل معادن مثل الإسفاليريت والكالكوبيريت.باختصار، فإن تكوين رواسب الذهب في هذه المنطقة يرتبط ارتباطًا وثيقًا بالعمليات الحرارية المائية المنخفضة الحرارة.

ومن خلال تقييم تأثير التمعدن بخصائص مختلفة في مناطق مختلفة، وجدت الدراسة أن التمعدن في "المنطقة 4" يرتبط ارتباطًا وثيقًا بالطيات المضادة والرصاص، وهناك رواسب معدنية في "المنطقة 5". يتأثر الودائع الشمالية بشكل إيجابي بالعناصر الأربعة Cu وPb وZn وAs، مما يشير إلى أن المنطقة المنخفضة تحتوي على معادن حرارية مائية متوسطة الحرارة ومنخفضة الحرارة؛ يتأثر الرواسب الجنوبية بشكل إيجابي بالزنك والزرنيخ، مما يشير إلى أن السوائل الحرارية المائية متوسطة الحرارة هي السوائل الرئيسية.
وبدمج بيانات الحفر الصادرة عن إدارة الموارد الطبيعية في نوفا سكوشا، نجد 39 سجلاً جيولوجياً للحفر متعلقاً بمناجم الذهب في الرواسب الشمالية في "المنطقة 5"، والتي تشمل مجموعة متنوعة من المعادن الحرارية المائية ذات درجات الحرارة المنخفضة والمتوسطة. هناك 4 سجلات حفر جيولوجية فقط تتعلق بمناجم الذهب في الرواسب الجنوبية من "المنطقة 5". تحتوي منطقة الودائع بشكل أساسي على معادن حرارية مائية متوسطة الحرارة مثل الكبريتيدات والأرسينوبيريت. يرتبط التمعدن في المنطقة 6 ارتباطًا وثيقًا باتصال الطية المضادة، مما يؤكد أيضًا استنتاج نوع التمعدن بناءً على التوزيع المكاني لقيم SHAP.

باختصار، يمكن للنموذج المبني على قيمة SHAP تحليل العوامل المختلفة التي تؤثر على نتائج التمعدن في المجال المكاني بأكمله بشكل كمي، ولديه القدرة على التفسير بشكل ممتاز وهو متوافق مع مبادئ علوم الأرض.وفي الوقت نفسه، قامت هذه الدراسة أيضًا بمقارنة خرائط التوزيع المكاني لقيم SHAP ومعاملات الانحدار. وتظهر النتائج أن التوزيع المكاني لمعاملات الانحدار لا يتوافق تماما مع القوانين الجيولوجية. لذلك، فإن قيم SHAP أكثر دلالة وأسهل للباحثين للإشارة إليها من معاملات الانحدار التقليدية.

البروفيسور دو تشن هونغ من جامعة تشجيانغ: التركيز على أبحاث البيانات الضخمة المكانية والزمانية والذكاء الاصطناعي
لقد انخرط فريق البحث بقيادة البروفيسور دو تشن هونغ من كلية علوم الأرض بجامعة تشجيانغ منذ فترة طويلة في البحث العلمي في الاستشعار عن بعد وأنظمة المعلومات الجغرافية والبيانات الضخمة المكانية والزمانية والذكاء الاصطناعي، وحقق سلسلة من النتائج في النظرية الأساسية وبحوث التكنولوجيا الرئيسية لتحليل البيانات الضخمة المكانية والزمانية في مجالات الجغرافيا والمحيطات والكوارث الجيولوجية وما إلى ذلك. وهو يقود الفريق لدمج نظم المعلومات الجغرافية والاستشعار عن بعد وعلوم الكمبيوتر بشكل كامل مع الجغرافيا والمحيطات والجيولوجيا وما إلى ذلك، واستكشاف فصل جديد في تطوير علوم الأرض القائمة على البيانات.
مراجع:
1.https://www.zast.org.cn/art/2022/12/8/art_1675105_58963288.html