HyperAIHyperAI

Command Palette

Search for a command to run...

مشروع جديد يسهل وصول الذكاء الاصطناعي إلى بيانات ويكيبيديا

أعلنت مؤسسة ويكيميديا الألمانية عن إطلاق مشروع جديد يُعرف بـ"مشروع تضمين ويكidata" الذي يهدف إلى تسهيل وصول نماذج الذكاء الاصطناعي إلى المعرفة الواسعة المخزنة في ويكيبيديا ومشاريعها الشقيقة. يُعد هذا المشروع خطوة مهمة في تهيئة البيانات الهيكلية من ويكidata، التي تضم نحو 120 مليون عنصر، لتصبح أكثر توافقًا مع النماذج اللغوية الكبيرة التي تعتمد على الفهم السياقي والبحث المعتمد على المعاني. بدلاً من الاعتماد على عمليات بحث كلمات مفتاحية أو لغة SPARQL المعقدة، يحول المشروع البيانات إلى متجهات رقمية تمثل العلاقات المفاهيمية بين المفاهيم، مما يمكّن النماذج من فهم السياق بدلاً من مجرد تطابق كلمات. تم تنفيذ المشروع بالتعاون مع شركة جينا أيه آي المتخصصة في البحث العصبي وشركة داتاستاك التابعة لشركة آي بي إم، التي تقدم البنية التحتية لتخزين البيانات المتجهة مجانًا. يُستخدم نموذج ذكاء اصطناعي من جينا أيه آي لتحويل 30 مليون عنصر من ويكidata إلى متجهات تمثل المفاهيم والروابط بينها، مثل ربط الكاتب دوغلاس آدامز بكتبها ومواليد وسياقات ثقافية مختلفة. هذه المتجهات تُمكّن النماذج من الاستجابة لأسئلة طبيعية بلغة البشر بشكل أكثر دقة، مثل استرجاع علماء نوويين مشهورين أو مصطلحات مرتبطة بمفهوم "عالم" بلغات متعددة. يُعد المشروع مبتكرًا في سياق الصراع على جودة البيانات التي تُستخدم لتدريب نماذج الذكاء الاصطناعي. في ظل تزايد الاعتماد على مجموعات بيانات ضخمة غير مُحكَّمة مثل كومون كراول، يبرز ويكidata كمصدر موثوق ومحسّن من قبل محررين متطوعين. كما يُعد هذا المشروع تجسيدًا لرؤية مفتوحة ومستقلة عن الشركات الكبرى، حيث أكد مدير المشروع فليب سادé أن الذكاء الاصطناعي القوي لا يجب أن يكون تحت سيطرة عدد قليل من الشركات، بل يمكن أن يكون نتاجًا تعاونيًا يخدم الجميع. يأتي المشروع في وقت تشهد فيه منافسة حادة على البيانات عالية الجودة، حيث تدفع شركات كبرى مثل أنتروبيك إلى دفع مبالغ ضخمة لتسوية دعاوى متعلقة بحقوق الملكية. في المقابل، يسعى ويكidata إلى تمكين الشركات الصغيرة والمبتكرين من الوصول إلى بيانات موثوقة دون الحاجة إلى موارد ضخمة. كما يُتوقع أن يسهم المشروع في تحسين دقة النماذج في مجالات غير ممثلة جيدًا على الإنترنت، مثل المعلومات الحكومية أو المواضيع المتخصصة. تم إتاحة قاعدة البيانات للجمهور عبر منصة تولفورم، وستُعقد جلسة حوارية للتطويرين في 9 أكتوبر. ورغم أن البيانات الحالية لا تشمل التحديثات الأخيرة، إلا أن التغييرات الصغيرة في ويكidata لن تؤثر بشكل كبير على فعالية المتجهات، لأنها تعكس الفكرة العامة للمفهوم. المشروع يُعد خطوة استراتيجية في تعزيز مصداقية الذكاء الاصطناعي وتمكين مجتمعات التعلم المفتوح من التأثير في مستقبل التكنولوجيا.

الروابط ذات الصلة

مشروع جديد يسهل وصول الذكاء الاصطناعي إلى بيانات ويكيبيديا | القصص الشائعة | HyperAI