خلف جائزة تورينج: لقد اختاروا المسار الصحيح وراهنوا على السيناريو الصحيح قبل 30 عامًا

أحد الشروط اللازمة للفوز بجائزة تورينج هو تحقيق اختراقات بحثية كبيرة في مجال الكمبيوتر وتقديم مساهمات مهمة للمجتمع. والسبب الذي يجعل العلماء الثلاثة السابقين يستحقون هذه الجائزة هو أنهم لم يحققوا إنجازات أكاديمية عظيمة في مجال البحث العلمي فحسب، بل إنهم أيضا في طليعة إيجاد حلول عملية لمشاكل العالم الحقيقي.
منذ إنشائها في عام 1966، تم منح جائزة تورينج في الغالب للأفراد الذين قدموا مساهمات مهمة لصناعة الكمبيوتر.
فازت ثلاثة أسماء كبيرة في مجال التعلم العميق بأعلى جائزة في صناعة الكمبيوتر في عام 2018 - جائزة تورينج. جوائزهم تستحقها بجدارة. منذ الوقت الذي لم يكن فيه التعلم العميق مفهومًا ومقدَّرًا إلى تطبيقه الحالي في كل مكان تقريبًا، فقد قدموا مساهمة لا غنى عنها في ابتكار هذه التكنولوجيا وتعزيزها.

ولن ندخل في تفاصيل تقاريرهم وإنجازاتهم هنا. وبدلاً من ذلك، سنلقي نظرة على بعض المشاهد الصغيرة لنرى كيف تغلب هؤلاء الباحثون الثلاثة على كل العقبات على طول الطريق.
نشأت تقنية LeCun المميزة من الشيكات المصرفية
ما دفع ليكون إلى الانخراط في التعرف على خط اليد كان في الواقع مشروعًا يعتمد على الصدفة. في ذلك الوقت، كان ليكون، الذي كان في أوج عطائه، يعمل كقائد فريق في مختبرات بيل (التي كانت مملوكة آنذاك لشركة AT&T). وباعتبارها شركة تكنولوجيا الاتصالات الرائدة في ذلك الوقت، خططت شركة AT&T للتعاون مع البنوك الكبرى في الولايات المتحدة لتنفيذ مشاريع بحثية جديدة.
أكبر صداع للبنوك هو كيفية التعرف على عدد كبير من الشيكات والفواتير المكتوبة بخط اليد. في ذلك الوقت، كان التعرف على الحروف المكتوبة بخط اليد يشكل تحديًا صعبًا، وكانت الطرق التقليدية بطيئة وكانت معدلات التعرف عليها منخفضة.
قام ليكون بدمج خوارزمية الانتشار الخلفي في الشبكة العصبية التلافيفية (CNN) واستخدم ما يقرب من 10000 عينة رقمية مكتوبة بخط اليد قدمتها هيئة البريد الأمريكية لتدريب النظام. في عملية الاختبار الفعلية، كان معدل الخطأ 5 % فقط.

وبعد ذلك، تم استخدام هذه التكنولوجيا المبتكرة في أنظمة التعرف على الشيكات في أجهزة الصراف الآلي للعديد من البنوك. وفي أواخر تسعينيات القرن العشرين، كان هذا النظام قادراً على التعامل مع ما بين 10% إلى 20% من الشيكات في الولايات المتحدة.
وقد اقترح ليكون لأول مرة في بحثه إنشاء شبكة CNN وحقق دقة على المستوى التجاري في ظل الظروف السائدة في ذلك الوقت. ويثبت أن الشبكات العصبية العميقة تتمتع بمزايا طبيعية في معالجة الصور.
ومع ذلك، بسبب التكنولوجيا والأجهزة في ذلك الوقت، كان تطوير الشبكات العميقة لا يزال يعاني من العديد من العيوب، مثل عدم كفاية قوة الحوسبة. على الرغم من أن الخوارزمية حققت نجاحًا كبيرًا، إلا أنها استغرقت ثلاثة أيام للتدريب على مجموعة البيانات.
وفي الفترة التي تلت ذلك، تم استقبال الذكاء الاصطناعي مرة أخرى ببرود. إلى جانب سهولة استخدام آلات الدعم المتجه (SVM)، لم يتم أخذ التعلم العميق على محمل الجد، بل تم اعتباره بدلاً من ذلك تقنية جانبية.
عنوان الورقة:http://yann.lecun.com/exdb/publis/pdf/lecun-89e.pdf
تبحث شركة LeCun عن سيناريوهات جديدة للقيادة الذاتية
ولم تبدأ هذه التكنولوجيا، التي لم تكن تحظى بتقدير معظم الناس في الأصل، في التألق ببطء إلا في عام 2006، وذلك بفضل المثابرة الطويلة الأمد والترويج من جانب يوشوا بينجيو، ويان ليكون، وجيفري هينتون، وآخرين، ودمج بعض الأفكار والأساليب الجديدة.
ويُعرف عام 2006 أيضًا بأنه العام الأول للتعلم العميق. نجح هينتون في حل المشكلة التي واجهها من قبل: مشكلة التدرج المتلاشي في الشبكات العميقة.
القفز إلى 2009-2010،تعاون ليكون وجامعة نيويورك في تجربة لتحديد المباني والسماوات والطرق والمشاة والمركبات من الصور باستخدام تقنية التعلم العميق.

الخطوة الأساسية في التعرف على الصور هي تحليل المشهد، والذي يتضمن وضع علامة على كل عنصر في الصورة بالفئة المقابلة له، يليه تقسيم المنطقة ووضع العلامات. إن التحدي الذي يواجه هذه الخطوة هو أنها تجمع بين مشاكل الكشف التقليدية والتجزئة ومعالجة التعرف على العلامات المتعددة.
ولتحقيق تصنيف بصري جيد ودقة عالية، استخدموا الشبكات العصبية التلافيفية. في الدراسة، تم توضيح شبكة تلافيفية تغذية أمامية، والتي، من خلال التدريب الشامل الخاضع للإشراف، استخرجت مقاييس متعددة من وحدات البكسل الأصلية من صور كبيرة الحجم، محققة بذلك المستوى الأكثر تقدمًا في ذلك الوقت على مجموعة بيانات تحليل المشهد القياسية.

ومن الجدير بالذكر أن هذا النموذج لا يعتمد على هندسة الميزات، بل يستخدم التعلم الخاضع للإشراف، والذي تم تدريبه من صور مُسمّاة بالكامل لتعلم الميزات منخفضة المستوى ومتوسطة المستوى بشكل صحيح.
عنوان الورقة:http://yann.lecun.com/exdb/publis/pdf/farabet-pami-13.pdf
أفضل علاقات عامة لجوجل: هينتون واعتلال الشبكية السكري
إذا قلنا أن التعلم العميق اجتذب تدريجيًا المزيد من الباحثين منذ عام 2006، فبعد عام 2012 دخل تطويره رسميًا في وضع سريع.
في عام 2012، استخدم الفريق بقيادة هينتون أساليب الشبكة العصبية العميقة لتحقيق فوز واضح في التعرف على الصور في مسابقة ImageNet.
في عام 2016، هزم برنامج AlphGo، الذي يعتمد على التعلم العميق، لي سيدول، كما ساعد التعلم العميق أيضًا في جعل الذكاء الاصطناعي معروفًا لكثير من الناس. بعد سنوات من الصمت، دخل التعلم العميق رسميًا فترة من النمو المتفجر، وتم إثبات إمكاناته بالكامل في العديد من المجالات مثل المعالجة البصرية والتعرف على الكلام.
مثال صغير جدًا:في عام 2017، قاد جيفري هينتون Google Brain لاستخدام طريقة تصنيف جديدة للمساعدة في التشخيص الطبي.ومن خلال نمذجة العلامات الفردية لتحسين قدرات التصنيف، أثبتنا أيضًا أن نهج العلامات هذا يحسن دقة التشخيص بمساعدة الكمبيوتر لاعتلال الشبكية السكري.

تُستخدم هذه الطريقة المبتكرة لمعالجة كميات هائلة من البيانات الواقعية التي تتطلب تصنيفًا من قبل خبراء.
في ذلك الوقت، كانت مهمة تصنيف مجموعة البيانات تُقسم عادةً بين العديد من الخبراء، حيث كان كل منهم يقوم بتسمية جزء صغير فقط من البيانات، وكانت نفس نقطة البيانات تحتوي على تصنيفات تم تمييزها بواسطة العديد من الخبراء.
ويمكن أن يساعد هذا النهج في تقليل عبء العمل الفردي ويساعد أيضًا في الكشف عن الحقائق التي يصعب العثور عليها في البيانات. عندما يختلف الخبراء حول تسمية نفس نقطة البيانات، فإن النهج القياسي هو أخذ التسمية التي تحظى بدعم أكبر من الخبراء باعتبارها التسمية الصحيحة، أو نمذجة التسمية الصحيحة للحصول على حالة التوزيع.
ومع ذلك، يتجاهل هذا النهج معلومات مفيدة محتملة حول الخبراء الذين قاموا بوضع العلامات على كل علامة. على سبيل المثال، قد يتم في نهاية المطاف تجاهل الموقف الذي اكتشفه خبير يتمتع بخبرة فريدة من قبل الخوارزمية لأن لا أحد آخر على علم به.
واقترح فريق Google Brain نمذجة الخبراء بشكل منفصل ثم تعلم الأوزان المتوسطة لدمج هذه المعلومات، ربما بطريقة خاصة بالعينة. وبهذه الطريقة، يمكن إعطاء وزن أكبر للخبراء الأكثر موثوقية، ويمكن الاستفادة من نقاط القوة الفريدة للخبراء الأفراد لتصنيف أنواع معينة من البيانات.

وبتطبيق الشبكات العصبية العميقة، استخدموا طريقة التصنيف هذه لتحسين تشخيص مرض السكري من خلال شبكية العين، وكان أداء الخوارزمية التي قدموها أيضًا أفضل من الطرق الأخرى.
اختر المسار الصحيح واقترب من جائزة تورينج
27 مارس 2019تم الإعلان عن جائزة تورينج لعام 2018، وفاز بالجائزة ثلاثة من ممارسي التعلم العميق على المدى الطويل وهم يوشوا بينجيو، وجيفري هينتون، ويان ليكون.والسبب هو أنهم لعبوا دورًا حاسمًا في تطوير الشبكات العصبية العميقة.

في الواقع، إن مساهمات هؤلاء الأشخاص الثلاثة في تطوير التعلم العميق كثيرة جدًا بحيث لا يمكن ذكرها كلها، والسيناريوهات الثلاثة المذكورة في هذه المقالة ليست سوى واحدة من الفرص المتاحة لنجاحهم. يمكننا أن نرى المجد بعد الفوز بجائزة، ولكن بالنسبة لهم، فإن الشيء الأكثر قيمة يجب أن يكون عقودًا من التفاني والشغف بالمسار والتكنولوجيا التي يؤمنون بها.