لماذا فاز شقيق ليكون الأصغر بينجيو بالجائزة مع سلفه؟

وصف السيناريو:ساهم بحث بنجيو في مجال التعلم العميق في تعزيز تقدم الترجمة الآلية، وفي نهاية المطاف، أكسبته إنجازاته جائزة تورينج لعام 2018.
الكلمات المفتاحية:جائزة تورينج لترجمة الآلات ذات التعلم العميق
في عام 1988، ربما لم يتوقع يوشوا بينجيو، طالب الدكتوراه المتخصص في هندسة الكمبيوتر في جامعة ماكجيل في كندا، أنه بعد أكثر من 30 عامًا، سيفوز بجائزة تورينج مع مثله الأعلى جيفري هينتون.
ولد بنجيو في فرنسا ونشأ في مونتريال، كندا الناطقة بالفرنسية. لقد أحب الخيال العلمي منذ أن كان طفلاً. على سبيل المثال، رواية "هل يحلم الروبوتات بالأغنام الكهربائية" للكاتب فيليب ك. ديك هي الرواية التي أثارت إعجابه أكثر من غيرها. يحكي قصة روبوت حساس تم إنشاؤه بواسطة مؤسسة كبيرة، والذي يصبح في نهاية المطاف شريرًا بسبب تأثير البيئة.
عندما قرأ بنجيو إحدى أوراق هينتون، شعر وكأنه تعرض لصعقة كهربائية لأنه وجد شعورًا في قصص الخيال العلمي التي أحبها كثيرًا في طفولته، وساعدته في العثور على اتجاه بحثه الخاص.
بعد حصوله على درجة ما بعد الدكتوراه من معهد ماساتشوستس للتكنولوجيا، انضم بينجيو إلى مختبرات بيل وأصبح عضوًا في فريق ليكون. وفي هذه اللحظة بدأت علاقته بجائزة تورينج رسميًا.
قبل أن يتدخل بنجيو، كانت الترجمة الآلية مجرد حل مؤقت
عندما اختار بنجيو مجال بحثه، ربما لم يكن لديه أي فكرة عن مدى التأثير الذي سيحدثه. تبدأ هذه القصة مع أول آلة ترجمة من إنتاج شركة IBM.
تم اختراع آلة الترجمة هذه في ثمانينيات القرن العشرين، عندما كانت التكنولوجيا السائدة هي الترجمة الآلية القائمة على القواعد (RBMT). الطريقة الأكثر شيوعًا هي ترجمة الكلمة بكلمة مباشرة من القاموس، ثم إضافة قواعد نحوية لتصحيحها. لكن النتائج مخيبة للآمال للغاية، لأنها تبدو "غبية" للغاية، مثل:
بالنسبة لهذا الشعار، إذا لم نأخذ السياق بعين الاعتبار، فإن نتائج الترجمة اليدوية تكون مختلفة: "هل يمكننا أن نكون عاهرات؟" "لدينا الحق في أن نكون عاهرات"! "نحن نصنع النصف الأيمن من الدجاج"... ناهيك عن الترجمة الآلية المبنية على القواعد.
على سبيل المثال، شعار KFC:"نحن نصنع الدجاج بالطريقة الصحيحة"نتيجة الترجمة الآلية القائمة على القواعد هي:"نحن نصنع الدجاج بشكل صحيح"،أو،"نحن زوجان دجاج"…

ولذلك اختفت هذه الطريقة في الترجمة بحلول ثمانينيات القرن العشرين.
وفي وقت لاحق، ظهرت الترجمة الآلية القائمة على مجموعة النصوص، والتي تم تقسيمها إلى أساليب الترجمة الآلية القائمة على الإحصائيات (SBMT) والترجمة الآلية القائمة على المثيل (EBMT). وبمصطلحات بسيطة، فهو نموذج لاستخراج الجملة. عندما تقوم بإدخال جملة تريد ترجمتها، فسوف يقوم النظام بالبحث عن جمل مشابهة في مجموعة النصوص ثنائية اللغة، ثم يقوم باستبدال ترجمات المفردات المختلفة.
على سبيل المثال:
لقد أعطيت شياو مينغ قلمًا.
أعطيت لي مينغ تفاحة.
بالنسبة لهذه الجمل، يمكنك استخراج الأجزاء المتشابهة واستبدال الكلمات مباشرة في الأماكن المختلفة.
ومع ذلك، فإن هذه الطريقة لها متطلبات عالية جدًا فيما يتعلق ببنية مجموعة النصوص ثنائية اللغة، وتقسيم حبيبات أجزاء العبارات، ومواءمة أزواج الجمل النموذجية، وإعادة تنظيم الأجزاء، وهناك العديد من المشاكل. ولذلك، كانت هناك فجوة كبيرة بين الترجمة الآلية والترجمة اليدوية في ذلك الوقت.
آلية الاهتمام، إصلاح الترجمة الآلية
على مدى نصف القرن الماضي، مر تطور الترجمة الآلية بالعديد من التقلبات والمنعطفات، ولكن لم يكن هناك أي تحسن كبير.
منذ خمس أو ست سنوات، كان تطبيق Google Translate يعتمد على الترجمة الآلية الإحصائية القائمة على العبارات (SMT)، وكانت SMT تُعتبر دائمًا أسلوب الترجمة الآلية الأكثر تقدمًا. ومع ذلك، بالنسبة للعديد من الناس، فإن الترجمة الآلية هي مجرد أداة "بديلة".

ولم يتحقق هذا الإنجاز التاريخي إلا في عام 2014 عندما تمكنت تقنية التعلم الآلي من تحقيق تقدم كبير بفضل الشبكات العصبية.
وهذا بفضل يوشوا بنجيو.
في عام 2001، يوشوا بينجيو وآخرون. نُشرت ورقة بحثية بارزة في NIPS (التي تمت إعادة تسميتها إلى NeurIPS في نوفمبر من العام الماضي)."نموذج اللغة الاحتمالي العصبي"، باستخدام متجهات الكلمات عالية الأبعاد لتمثيل اللغة الطبيعية. كما قدم فريقه آلية الانتباه، والتي مكنت من تحقيق تقدم كبير في الترجمة الآلية وأصبحت تقنية مهمة للتعلم العميق لمعالجة التسلسلات.
في عام 2014، نشرت ورقة يوشوا بينجيوتعلم تمثيل العبارات باستخدام مُشفِّر وفكِّ تشفير RNN للترجمة الآلية الإحصائيةوفيها تم وضع البنية الأساسية لتقنية التعلم العميق المستخدمة في الترجمة الآلية لأول مرة. ويستخدم بشكل أساسي شبكة عصبية متكررة تعتمد على التسلسل (RNN) للسماح للآلة بالتقاط سمات الكلمات بين الجمل تلقائيًا، ثم كتابة نتائج الترجمة تلقائيًا إلى لغة أخرى.

عندما خرج هذا المقال، كان جوجل في غاية السعادة. وبعد فترة وجيزة، وبفضل إمدادات كافية من البارود من جوجل وبركة الآلهة، نُشرت الورقة البحثية على موقع ArXiv.org في سبتمبر/أيلول 2016.نظام الترجمة الآلية العصبية من جوجل: سد الفجوة بين الترجمة البشرية والترجمة الآلية.
وفي الوقت نفسه، أعلنت شركة جوجل رسميًا أن جميع الترجمات الآلية الإحصائية سوف تُزال من على الرفوف، وأن الترجمة الآلية القائمة على الشبكات العصبية سوف تتولى زمام الأمور وتصبح التيار الرئيسي المطلق للترجمة الآلية الحديثة.
أعلنت شركة جوجل أنه بعد حوالي 27 عامًا، انتقلت الترجمة الآلية رسميًا من نموذج الترجمة الآلية لشركة IBM لعام 1989 (PBMT، الترجمة الآلية القائمة على العبارات) إلى نموذج الترجمة الآلية للشبكة العصبية، مما أدى إلى زيادة دقة الترجمة إلى 87%. تزعم شركة جوجل أن معدل الخطأ في أزواج اللغات المتعددة مثل "الإنجليزية-الفرنسية"، و"الإنجليزية-الصينية"، و"الإنجليزية-الإسبانية" انخفض بمقدار 60% مقارنة بنظام الترجمة الآلية الإحصائية السابق.

إن معدل الدقة هذا قريب جدًا من معدل دقة ترجمة الأشخاص العاديين. وأفاد تقرير معهد ماساتشوستس للتكنولوجيا بأن "هذا الصوت لا يمكن تمييزه تقريبًا عن الإنسان" وأنه "يظهر بشكل ممتاز قوة الترجمة الآلية للشبكات العصبية".

أحدثت هذه الأخبار ضجة كبيرة في الأوساط التكنولوجية في ذلك الوقت، وأصبح نظام الترجمة الآلية للشبكة العصبية من جوجل (GNMT) معلمًا رئيسيًا في تاريخ الترجمة الآلية. ومن الجدير بالذكر أن GNMT يستخدم تقنية الترجمة الآلية للشبكة العصبية (NMT) التي ابتكرها يوشوا بينجيو وفريقه المتخصص في التعلم العميق في جامعة مونتريال في كندا.
ولذلك، يمكن القول إن يوشوا بينجيو ساهم في تعزيز تقدم فهم اللغة الطبيعية وتكنولوجيا معالجتها، وتم دمج الأبحاث التي شارك فيها لاحقًا في العديد من منتجات الترجمة الآلية ومساعد الذكاء الاصطناعي.
بعد NMT، مائة مدرسة فكرية
في مقابلة أجريت معه عام 2016، تحدث يوشوا بينجيو عن الأبحاث السابقة التي جعلته يشعر بالفخر.لأعطيكم مثالاً حديثاً نسبياً، شهدنا مؤخراً بعض التطورات في الترجمة الآلية، ويعود الفضل في جزء كبير منها إلى عمل فريقنا البحثي، "الترجمة الآلية العصبية"، الذي طُوّر قبل عامين تقريباً ويُستخدم الآن في مختبرات حول العالم. تُعد هذه التقنية الأكثر تطوراً في الترجمة الآلية، وهي المرة الأولى التي تُحقق فيها الشبكات العصبية تقدماً كبيراً في هذا المجال. في السابق، حققت الشبكات العصبية تقدماً هائلاً في مجالات مثل التعرف على الكلام والرؤية الحاسوبية، لكن الترجمة الآلية ومعالجة اللغة الطبيعية لا تزالان في مراحلهما الأولى. لذا، أعتقد أن هذا إنجازٌ يستحق الفخر.
وبناءً على تقنية NMT، أطلقت العديد من شركات تكنولوجيا الإنترنت أيضًا مبادرات جديدة على التوالي. في أكتوبر 2017، أطلقت جوجل منتجًا جديدًا للأجهزة، وهو سماعات Pixel Buds، التي تدمج مساعد جوجل والترجمة في الوقت الفعلي ووظائف أخرى، وتدعم الترجمة في الوقت الفعلي بـ 40 لغة.
وفي السنوات التالية، أطلقت شركات محلية مثل NetEase Youdao وiFLYTEK وSogou أيضًا منتجات آلات الترجمة، والتكنولوجيا التي تدعمها لا تنفصل عن NMT.
في مارس 2018، أعلن الباحثون في معهد ريدموند للأبحاث التابع لشركة مايكروسوفت للأبحاث في آسيا أنهم أضافوا بنية ترجمة آلية تعتمد على الشبكة العصبية.التعلم المزدوجإلى جانبشبكات المداولةلقد حقق نظام الترجمة الآلية الذي طوره الفريق مستوى مماثلاً لمستوى الترجمة البشرية في مجموعة اختبار الترجمة الصينية الإنجليزية لمجموعة اختبار التقارير الإخبارية العامة newstest2017.
تخيل لو لم يتم اقتراح ترجمة الشبكة العصبية، ربما كنا لا نزال في المرحلة التي تكون فيها أقسام كبيرة من الترجمة مليئة بالأخطاء النحوية وتكون النتائج "فظيعة". قد يواجه محرر الذكاء الاصطناعي الخارق أيضًا خطر الفصل بسبب ضعف اللغة الإنجليزية والترجمة السيئة...
لذا، بفضل بنجيو، وبفضل الترجمة الآلية العصبية، فإن جائزة تورينج تستحقها بجدارة.