على الرغم من أن تطبيق Google Translate تم إصداره منذ ما يقرب من 15 عامًا، إلا أنه لا يزال يعتقد بعناد أن هواتف Android سريعة جدًا.
وكان التحديث الرئيسي الأحدث لـ GT هو تقديم نظام الترجمة الآلية العصبية (GNMT) في عام 2016، والذي يتضمن 8 أجهزة ترميز و8 أجهزة فك تشفير للترجمة إلى 9 لغات.
لا يقومون بفصل الجمل فحسب، بل يقومون أيضًا بفصل الكلمات، وهذه هي الطريقة التي يتعاملون بها مع الكلمة النادرة. عندما لا تكون الكلمة موجودة في القاموس، لا يوجد مرجع لـ NMT. على سبيل المثال، فكر في ترجمة مجموعة الحروف "Vas3k". في هذه الحالة، يحاول GMNT تقسيم الكلمة إلى أجزاء واستعادة ترجمتها.
لكن لا يزال من غير الممكن تفسير سبب ترجمة "卡顿" إلى "سريع جدًا". وعلاوة على ذلك، بعد أن أصبحت هذه الترجمة نكتة متداولة على نطاق واسع بين المهندسين المحليين في الأيام الأخيرة، فإن تصحيح الأخطاء الجماعي الفخور من قبل جوجل لا يزال يفشل في التدخل بنجاح في هذه الترجمة الخاطئة.
كانت هذه النكتة الصغيرة هي التي جعلتنا نرغب في البدء في البحث عن الترجمة الآلية. ستستعرض هذه المقالة تطور الترجمة الآلية على مدى السنوات الستين الماضية، بما في ذلك الأساليب السائدة مثل الترجمة الآلية القائمة على القواعد (RBMT)، والترجمة الآلية القائمة على الأمثلة (EBMT)، والترجمة الآلية الإحصائية (SMT)، والترجمة الآلية العصبية (NMT)، بالإضافة إلى تحليل الخوارزميات الرائدة من الشركات المصنعة مثل Google و Yandex.
أنت تقرأ النصف الأول من هذه السلسلة من المقالات، "الترجمة الآلية 1933-1984".
العقود الأربعة الأولى من التقدم البطيء
ظهرت الترجمة الآلية لأول مرة في عام 1933، أثناء الحرب الباردة.
في ذلك الوقت، اقترح العالم السوفييتي بيتر ترويانسكي في الأكاديمية السوفييتية للعلوم "تطوير آلة يمكن استخدامها لترجمة اللغات وطباعة النصوص". كانت الآلة بسيطة للغاية - مجرد بطاقات بأربع لغات مختلفة، وآلة كاتبة، وكاميرا أفلام قديمة الطراز.
يأخذ المشغل الكلمة الأولى من النص، ويجد البطاقة المقابلة، ويلتقط صورة لها، ويكتب سماتها الصرفية (الاسم، الجمع، الجر، إلخ) على الآلة الكاتبة. وقد قامت الآلة الكاتبة بالترجمة وفقًا لبعض هذه الخصائص وعرضتها على شريط مغناطيسي وفيلم كاميرا.
على الرغم من أنه كان بإمكانه إجراء ترجمات بسيطة، إلا أنه كان يُعتبر اختراعًا "عديم الفائدة" في ذلك الوقت. لسوء الحظ، أمضى ترويانسكي 20 عامًا في العمل على هذا الاختراع، وفي النهاية توفي بسبب الذبحة الصدرية، وانتهى الاختراع. قبل أن يتم اكتشاف هذه الآلة من قبل العلماء السوفييت في عام 1965، لم يكن أحد تقريبًا في العالم يعلم بوجودها.
في 7 يناير 1954، في بداية الحرب الباردة، ظهرت أول آلة ترجمة حقيقية في التاريخ، وهي IBM 701، في المقر الرئيسي لشركة IBM في نيويورك. لقد نجح في ترجمة 60 جملة روسية إلى الإنجليزية. كانت هذه تجربة جورج تاون-IBM الشهيرة.
ولكن الحيلة المثالية كانت لتغطية تفاصيل صغيرة. ولم يذكر أحد أن الأمثلة المترجمة تم اختيارها واختبارها بعناية لتجنب أي غموض. بالنسبة للاستخدام اليومي، لا يعد هذا النظام أفضل من دليل الترجمة السريع.
ومع ذلك، فإن أساس معالجة اللغة الطبيعية الحديثة تم إنشاؤه من قبل العلماء، بما في ذلك أولئك الموجودين في الولايات المتحدة، من خلال التجارب المستمرة والبحث والتطوير. تعتمد جميع محركات البحث ومرشحات البريد العشوائي والمساعدين الشخصيين اليوم على هذا.
الترجمة الآلية القائمة على القواعد (RBMT)
ظهرت فكرة الترجمة الآلية القائمة على القواعد لأول مرة في سبعينيات القرن العشرين، عندما قام العلماء بمراقبة عمل المترجمين بعناية وحاولوا إجبار أجهزة الكمبيوتر على تكرار تلك الإجراءات. وتشمل هذه الأنظمة:
-
قاموس ثنائي اللغة (RU -> EN)
-
تحتوي كل لغة على مجموعة من القواعد اللغوية (على سبيل المثال الأسماء التي تنتهي بلواحق معينة، مثل -heit، -keit، -ung، وما إلى ذلك)، والتي تشكل الجزء الجذر من الكلام.
إذا لزم الأمر، يمكن للنظام أيضًا إضافة بعض الحيل، مثل قوائم الأسماء، ومصححات التهجئة، والمترجمين.
يعد PROMPT وSystran من أشهر الأمثلة على أنظمة RBMT، على الرغم من وجود بعض الفروق الدقيقة والأنواع الفرعية لها.
-
الترجمة الآلية المباشرة
هذا هو النوع الأكثر مباشرة من الترجمة الآلية. يقوم بترجمة الكلمات في النص واحدة تلو الأخرى ويصحح صياغتها قليلاً وينسق القواعد النحوية لجعل الفقرة بأكملها تبدو وكأنها مترجمة بشكل أكثر دقة. أما قواعد التعديل هذه فهي يضعها لغويون محترفون.
ومع ذلك، فإن قواعد الترجمة هذه تفشل أحيانًا وتصبح الترجمة رديئة. على الرغم من أن الأنظمة الحديثة لا تستخدم هذه القاعدة على الإطلاق، إلا أنها تحظى بشعبية كبيرة بين اللغويين المعاصرين.
-
الترجمة الآلية المبنية على البنية النحوية
بالمقارنة مع الترجمة الحرفية، فإننا نحدد أولاً البنية النحوية للجملة، تماماً مثل ما علمنا إياه معلمونا في المدرسة. نقوم بعد ذلك بتحليل البنية بأكملها بدلاً من الكلمات الفردية، وهو ما يساعد نظريًا في الحصول على تحويل جيد إلى حد معقول لترتيب الكلمات في الترجمة.
لكن في الممارسة العملية، لا يزال هذا النهج يعاني من بعض القيود. من ناحية، فإنه يبسط القواعد النحوية العامة، ولكن من ناحية أخرى، تصبح ترجمته أكثر تعقيدًا بسبب زيادة بنية الكلمات مقارنة بالكلمات المفردة.
-
الترجمة الآلية للغات متعددة
في هذا النهج، يتم تحويل النص المصدر إلى تمثيل وسيط وتوحيده عبر جميع لغات العالم (interlingua). إنه نفس ما حلم به ديكارت: لغة ميتافيزيقية تتبع قواعد عالمية وتحوّل الترجمة إلى مهمة "ذهابًا وإيابًا" بسيطة. يتيح هذا لـ Interlingua الترجمة إلى أي لغة مستهدفة.
وبسبب هذا التحويل، غالبًا ما يتم الخلط بين Interlingua وأنظمة اللغة المعدنية القائمة على النقل. الفرق هو أن قواعد اللغة خاصة بكل لغة وزوج لغوي، وليس لأزواج اللغات. وهذا يعني أننا نستطيع أن نضيف لغة ثالثة إلى نظام اللغات المتداخلة ونترجم بين اللغات الثلاث، وهو أمر يصعب تحقيقه في نظام الترجمة المبني على البنية النحوية.
يبدو مثاليًا، لكنه في الحياة الواقعية ليس كذلك. إن إنشاء هذه اللغة المتبادلة أمر صعب للغاية، فقد كرس العديد من العلماء حياتهم بأكملها لدراستها. ورغم أنها لم تكن نجاحاً كبيراً، فبفضلها أصبح لدينا الآن تمثيلات على المستويات الصرفية، والنحوية، وحتى الدلالية.
ومع ذلك، فإن RBMT لديها أيضًا مزايا، مثل دقتها الصرفية (فهي لا تخلط بين الكلمات)، وإمكانية إعادة إنتاج نتائجها (يحصل جميع المترجمين على نفس النتائج)، وقدرتها على التكيف مع مجالات الموضوع (على سبيل المثال، لتدريس المصطلحات للاقتصاديين أو المهندسين).
حتى لو نجح شخص ما في إنشاء RBMT مثالي، واستمر اللغويون في تعزيزه بكل قواعد التهجئة، فستكون هناك دائمًا استثناءات لا يمكنه التعامل معها. على سبيل المثال، الأفعال غير المنتظمة في اللغة الإنجليزية، والبادئات المنفصلة في اللغة الألمانية، واللواحق في اللغة الروسية، والطرق المختلفة التي يعبر بها الناس عن أنفسهم.
وسوف تكون تكلفة إصلاح هذه الاختلافات الدقيقة هائلة. لا تنسَ المتجانسات، مما يعني أن نفس الكلمة يمكن أن يكون لها معاني مختلفة في سياقات مختلفة، مما يؤدي إلى العديد من الترجمات المحتملة لنفس الجملة. على سبيل المثال، عندما أقول "رأيت رجلاً يستخدم تلسكوبًا على تلة"، ما عدد المعاني التي تعتقد أنها متضمنة؟
لا تتطور اللغة على أساس مجموعة ثابتة من القواعد - وهي حقيقة يحبها اللغويون. خلال الأربعين عامًا من الحرب الباردة، ورغم تطور الترجمة الآلية، لم يتم التوصل إلى حل واضح لتحسين دقة الترجمة وراحتها.
ولذلك، فإن RBMT قد مات منذ فترة طويلة.
الترجمة الآلية القائمة على الأمثلة (EBMT)
بحلول ثمانينيات القرن العشرين، ومن أجل الحصول على موطئ قدم بأسرع ما يمكن في العولمة الوشيكة، كانت اليابان، حيث كان عدد قليل من الناس يعرفون اللغة الإنجليزية، في حاجة ماسة إلى الترجمة الآلية. وبفضل الدعم القوي من السياسات الوطنية، أصبحت اليابان الدولة الأكثر اهتماما بالترجمة الآلية في ذلك الوقت.
نظرًا لأن الترجمة الآلية القائمة على القواعد (RBMT) من الصعب ترجمتها من الإنجليزية إلى اليابانية لأن عملية الترجمة تتطلب إعادة ترتيب جميع الكلمات تقريبًا وتتضمن أيضًا كلمات جديدة، فإن هذا يجبر اليابانيين على البحث عن أفكار جديدة للترجمة.
لذلك، في عام 1984، اقترح ماكوتو ناجاو من جامعة كيوتو فكرة استبدال الترجمات المتكررة بعبارات جاهزة، وهو ما يسمى بالترجمة الآلية القائمة على الأمثلة (EBMT). كلما زاد عدد الحالات التي تدخلها، كلما كانت الترجمة أسرع وأكثر دقة.
وكان ظهور فكرة EBMT بمثابة الشرارة التي أشعلت الإلهام الإبداعي للعلماء. وهذا أمر ذو أهمية كبيرة لتطوير الترجمة الآلية، على الرغم من أنه لا يشكل ابتكارا ثوريا حتى الآن. ولكن بعد خمس سنوات من الآن، سوف تظهر ترجمة إحصائية ثورية بناءً على هذا.
معاينة المقال التالي
-
كانت حقبة الترجمة الآلية في الفترة من تسعينيات القرن العشرين إلى العقد الأول من القرن الحادي والعشرين تهيمن عليها الترجمة الآلية الإحصائية (SMT)؛
-
أخيرًا ظهرت الترجمة الآلية العصبية (NMT) لأول مرة في عام 2015؛
-
طريقة اللعب المتقدمة لـ Google و Yandex؛
مقالات تاريخية (انقر على الصورة للقراءة)
لماذا يوم 24 أكتوبر هو يوم المبرمجين؟ 》
"هذه الورقة سامة!" 》
"كيف تشرح الذكاء الاصطناعي لأقاربك وأصدقائك؟ 》
