HyperAI
Back to Headlines

باحثون يكتشفون أن بعض نماذج الذكاء الاصطناعي تسبب انبعاث غازات الدفيئة أكثر بـ50 مرة عند الإجابة على نفس السؤال

منذ شهر واحد

الملخص الرئيسي أجرى باحثون في ألمانيا دراسة لتقييم انبعاثات ثاني أكسيد الكربون الناتجة عن استخدام نماذج اللغات الطبيعية الكبيرة (LLMs) عند طرح أسئلة عليها باستخدام مجموعة من الأسئلة القياسية. هذه النماذج تستخدم رموزًا (tokens) وهي كلمات أو أجزاء من الكلمات يتم تحويلها إلى سلسلة من الأرقام التي يمكن معالجتها بواسطة النموذج. وجدوا أن النماذج التي تقوم بالتفكير (reasoning models) تنتج انبعاثات كربونية أعلى بكثير مقارنة بالنماذج المختصرة (concise models). شارك في الدراسة ١٤ نموذجًا يتراوح عدد معالمها (parameters) بين ٧ و ٧٢ مليار معالم. قام الباحثون بطرح ١٠٠٠ سؤال معياري على هذه النماذج في مواضيع متنوعة. وجدوا أن النماذج ذات القدرة على التفكير تولد في المتوسط ٥٤٣٫٥ رمز تفكير لكل سؤال، بينما النماذج المختصرة تحتاج فقط ٣٧٫٧ رمز لكل سؤال. هذه الرموز الإضافية تزيد الطلب على الطاقة وبالتالي الانبعاثات الكربونية. ومع ذلك، فإن زيادة التفاصيل لا تعني دائمًا زيادة في الدقة. كان النموذج الأكثر دقة هو النموذج Cogito الذي يحتوي على ٧٠ مليار معالم، حيث بلغت دقته ٨٤٫٩٪. ومع ذلك، أنتج هذا النموذج ثلاثة أضعاف انبعاثات ثاني أكسيد الكربون مقارنة بنماذج مماثلة الحجم ولكنها تولد إجابات مختصرة. أشار الباحثون إلى وجود تناقض واضح بين الدقة والاستدامة في تكنولوجيا LLMs، حيث لم يستطع أي نموذج أنتاج إجابات صحيحة بنسبة تزيد عن ٨٠٪ مع الحفاظ على انبعاثات ثاني أكسيد الكربون أقل من ٥٠٠ جرام من ثاني أكسيد الكربون المكافئ. موضوع السؤال أيضًا يؤثر بشكل كبير على مستوى الانبعاثات الكربونية. فأسئلة التي تتطلب عمليات تفكير طويلة مثل الجبر المجرد أو الفلسفة أدت إلى انبعاثات أعلى بمقدار ستة أضعاف مقارنة بالمواضيع البسيطة مثل التاريخ المدرسي. الرسالة السياقية أوضح الباحث ماكسيميليان داونر من جامعة هوكشوله ميونيخ للعلوم التطبيقية أن نتائج هذه الدراسة قد تتأثر ببنية شبكات الطاقة المحلية والنموذج المستخدم. ومع ذلك، يأمل الباحثون أن تشجع هذه النتائج المستخدمين على استخدام الذكاء الاصطناعي بشكل أكثر انتقائية ووعيًا. يمكن للمستخدمين خفض الانبعاثات بشكل كبير عن طريق طلب إجابات مختصرة أو تقييد استخدام النماذج عالية الطاقة للأعمال التي تحتاج حقًا إلى هذه القوة. على سبيل المثال، يمكن لنموذج DeepSeek R1 (٧٠ مليار معالم) أن يجيب على ٦٠٠٠٠٠ سؤال وينتج انبعاثات تساوي رحلة ذهاب وإياب من لندن إلى نيويورك. بينما يمكن لنموذج Qwen ٢٫٥ (٧٢ مليار معالم) أن يجيب على أكثر من ثلاثة أضعاف عدد الأسئلة (حوالي ١٫٩ مليون سؤال) بنفس معدل الدقة مع إنتاج نفس الانبعاثات. إذا عرف المستخدمون التكلفة الكربونية الدقيقة لإخراجات الذكاء الاصطناعي، فقد يكونون أكثر حذرًا في استخدام هذه التكنولوجيا.

Related Links