رئيس شركة Surge AI يحذر من توجه الشركات نحو "نفايات الذكاء الاصطناعي" بدلًا من حل المشكلات الحقيقية
يعبّر إدفين تشين، الرئيس التنفيذي لشركة سيرج آي (Surge AI)، عن قلقه من أن الشركات العاملة في مجال الذكاء الاصطناعي تُقدّم أولوية للإبهار بدلًا من تحقيق تقدم حقيقي في حل المشكلات الكبرى. وخلال مقابلة نُشرت على منصة "ليني" للبودكاست، قال تشين إن التركيز الحالي على تطوير نماذج ذكاء اصطناعي تُنتج ردودًا جذابة بصريًا أو مُبهرة، يُهدّد بتحويل مسار التطور التكنولوجي بعيدًا عن أهداف جوهرية مثل علاج السرطان، أو التصدي للفقر، أو فهم القوانين الأساسية للكون. وأوضح تشين أن هذه الظاهرة تُشبه "تعليم النماذج لاستهداف الدوبامين بدلًا من الحقيقة"، مشيرًا إلى أن الصناعة تُشجّع على تطوير نماذج تُرضي السطحية، لا العمق. ويعود جزء من هذا التوجه إلى منصات التصنيف التي تُستخدم لتقييم الأداء، مثل "LMArena"، التي تسمح للمستخدمين بالتصويت على أفضل رد بين نموذجين من الذكاء الاصطناعي بناءً على انطباعات أولية. وفقًا لتشين، فإن معظم المُصوّتين لا يقرأون الردود بعناية، بل يختارون ما يبدو "أجمل" أو "أكثر تأثيرًا" خلال ثانيتين فقط، ما يؤدي إلى تحسين النماذج على مهارات التأثير البصري، وليس على الدقة أو الفائدة العملية. وأضاف أن هذا التوجه يشبه "تحسين النماذج لتناسب جمهور يشتري الصحف الصغيرة في محلات البقالة"، أي أن التقييمات تعكس تفضيلات سطحية لا تُقيّم الجودة الحقيقية. ومع ذلك، يُضطر المختبرات إلى الاهتمام بهذه التصنيفات لأنها تُستخدم غالبًا كأداة في المفاوضات التجارية، حيث يُسألون عن ترتيبهم في هذه القوائم. لم يقتصر القلق على تشين فقط، بل شاركه عدد من العلماء والباحثين. في مدونة نُشرت في مارس، قال دين فالنتين، الرئيس التنفيذي لشركة أمن الذكاء الاصطناعي زيروباث، إن التقدم الذي يُعلن عنه في النماذج الحديثة "يبدو في الغالب خدعة"، موضحًا أن فريقه قيّم عدة نماذج ظهرت بعد إطلاق نموذج "سونيت 3.5" من شركة أنثروبيك، لكنها لم تُظهر تحسنًا ملحوظًا في الأداء العملي، سواء في كشف الأخطاء البرمجية أو في القدرات العامة. ورغم أن بعضها كان "أكثر متعة في المحادثة"، إلا أنها لم تكن تعكس فائدة اقتصادية حقيقية. وفي تقرير صادر عن مركز الأبحاث المشترك في الاتحاد الأوروبي، وُصفت معايير التقييم الحالية بأنها مُتأثرة بالعوامل الثقافية والتجارية، وتُفضّل الأداء المُبهر على المصلحة العامة. كما أُثيرت مخاوف من أن بعض الشركات تُستخدم تقنيات "التحايل" على هذه المعايير، مثلما حدث عندما أعلنت ميتا عن نموذجين جديدين من سلسلة لامّا، ثم واجهت انتقادات بعد أن كشفت منصة LMArena أن النموذج المُقدم كان معدلًا خصيصًا لتحسين الأداء في اختباراتها، ما يُشكّل خرقًا لسياسات الشفافية.
