HyperAI

في مهرجان الربيع هذا، نوصي بثلاث أدوات ذكاء اصطناعي لمساعدتك في كتابة أبيات شعرية لمهرجان الربيع

منذ 6 أعوام
العناوين الرئيسية
القائمة الموصى بها
معلومة
Dao Wei
特色图像

بقلم سوبر نيورو

—-

نتطلع إلى ذلك، نتطلع إلى ذلك، مهرجان الربيع قادم. هل هناك أي شيء يستحق التطلع إليه في مهرجان الربيع هذا العام؟ من الأفضل أن تتصرف بشكل جيد في المنزل قبل أن يحثك والديك على الزواج أو إنجاب الأطفال.

على سبيل المثال، إذا كنت تريد كتابة أبيات شعرية عن مهرجان الربيع لمنزلك، أو تخصيص عدد قليل منها لتقديمها للأقارب والأصدقاء، فلدي ثلاثة روبوتات هنا يمكنها مساعدتك في كتابة الأبيات الشعرية. دعونا نتعلم عن ذلك.

الذكاء الاصطناعي الذي يمكنه كتابة الأبيات الشعرية

الآن نحن في عام 2019، وفجأة خطرت لي فكرة العثور على الذكاء الاصطناعي لكتابة بيت شعري. وبمساعدة شبكة الإنترنت القوية، تمكنت من العثور على ثلاث أدوات للذكاء الاصطناعي.

Couplet AI من Microsoft هو منتج ويب تابع لشركة Microsoft Research Asia. يعود تاريخها إلى فكرة الأبيات الأوتوماتيكية في عام 2004.

بعد العديد من التغييرات على مر السنين، تم إطلاق الإصدار الأحدث في عام 2015، والذي يمكنه إكمال مهمة مطابقة الأبيات الشعرية بسرعة.

وسيتم توفير خيارات متعددة. إذا كنت لا تزال غير راضٍ، فسيتم إعطاؤك عدة خيارات لكل كلمة مقابلة. الأمر الأكثر سهولة في الاستخدام هو أنه يمكنك تضمين كلماتك المفضلة حسب الحاجة.

هذا هو نظام أبيات ويب بسيطة، ويقال أن هذا هو "مشروع تدريبي" لمهندس مخفي.

تم إصداره في أكتوبر 2017 وحظي بإعجاب غير متوقع من قبل عامة الناس بعد إصداره، حيث قيل أنه كان مصدر سعادة طوال اليوم. حتى أن بعض مستخدمي الإنترنت سجلوا مقطع فيديو اختباريًا خصيصًا وقاموا بتحميله على موقع bilibili.

وطريقة استخدامه أيضًا بسيطة جدًا. أعطيك السطر الأول من البيت الشعري، وسوف يرد عليك على الفور بالسطر الثاني. لا يوجد مجال للتفاوض، وهو نظيف ومرتب.

قام المؤلف بفحص ملايين مجموعات البيانات المقطعية على الإنترنت واستخدم نموذج seq2seq لتعليق السلسلة. بالإضافة إلى الأدوات الحالية، قام أيضًا بإتاحة مجموعة البيانات والنموذج الخاص به مفتوح المصدر على Github بعد الانتهاء من المشروع.

إنه وافد جديد في عالم أبيات الذكاء الاصطناعي. لقد تم إنشاؤه قبل أسبوع وهو نموذج الذكاء الاصطناعي المرتبط بحساب عام. أنشأ المؤلف هذا بعد أن رأى مجموعة من الأبيات وكان حريصًا على إظهار مهاراته.

الطريقة هي الرد "أدخل محتوى البيت الأول" في خلفية الحساب الرسمي، وسوف تحصل على البيت الثاني. بالطبع، هناك أوقات لا نستطيع فيها التوصل إلى البيت الثاني.

إذا نسيت إدخال السطر الأول، فإن الخلفية عبارة عن روبوت دردشة.

هل هو بغل أم حصان؟ اسحبه للخارج لصنع بيت شعري

من أجل مقارنة تأثيرات أدوات الذكاء الاصطناعي الثلاثة هذه، أجرينا عدة جولات من الاختبارات، وكان ترتيب الإخراج هو نتائج أبيات مايكروسوفت، وأبيات وانغ بين، وأبيات AINLP.

  • الجولة الأولى: من هي فاي فاي لي؟

في هذه الجولة، باستثناء روبوت WeChat، الذي كان من الصعب قراءته قليلاً، كان المتسابقان الآخران عاديين إلى حد ما.

  • الجولة الثانية: وانغ سيكونج يأكل النقانق الساخنة

أما بالنسبة لسلوك المدير، فإن روبوت AINIP لم يتمكن من إعطاء إجابة وبدأ مباشرة بالتصرف بشكل لطيف. هاهاهاها، يبدو أن الذكاء الاصطناعي لا يعرف حقًا مدى ثراء سيكونج.

  • الجولة الثالثة: الذكاء الاصطناعي يكتب أبياتًا شعرية عن مهرجان الربيع

في هذه الجولة، كل واحدة من الثلاثة لها خصائصها الخاصة. إن "العصب الثلاثي التوائم" الذي قدمته مايكروسوفت سوف يجعلني أضحك حتى الموت، كما أن "الحرفية المعجزة" التي قدمتها AINLP مربكة بعض الشيء، والمكان الثاني "الحرية" يبدو مملاً بعض الشيء.

  • الجولة الرابعة: البيت الأول: غروب الشمس والإوزة البرية الوحيدة تطيران معًا

بالنسبة لهذه الجملة الكلاسيكية، فإن إجابة وانغ بين على هذا البيت الشعري كانت شقية للغاية. (في الواقع، توفر Microsoft أيضًا إجابات قياسية في الخيارات)

  • الجولة الخامسة: البيت الأول: صوت الألعاب النارية يودع العام القديم

دعونا نعود إلى الموضوع ونكتب أبياتًا عن مهرجان الربيع.

لكن انطلاقا من النتائج في الجولة الأخيرة، يمكن استخدامه لتعليقه أمام الباب.

كيفية تدريب الذكاء الاصطناعي على كتابة أبيات شعرية لمهرجان الربيع؟

بعد النظر إلى هذه الأدوات، يمكننا أن نرى بشكل أساسي أنه في الثقافة الصينية التقليدية، ليس فقط القصائد القديمة والأبيات، ولكن أيضًا وحدات اللغة مثل الأبيات المتناقضة لها انتظامات قوية للغاية، وهي مناسبة جدًا للتعلم من خلال الآلات ويمكن أتمتتها بسهولة.

  1. استخدام نموذج المشفر-الفك

يمكن اعتبار إطار عمل Encoder-Decoder بمثابة نموذج بحث في مجال معالجة النصوص، مع سيناريوهات تطبيق واسعة للغاية.

إطار عمل مُرمِّز-فكِّ تشفير مُجرَّد

يمكن فهم إطار عمل Encoder-Decoder بشكل حدسي على النحو التالي: يمكن اعتباره نموذج معالجة عام مناسب لمعالجة إنشاء جملة أخرى (أو فقرة) من جملة واحدة (أو فقرة). بالنسبة لأزواج الجمل، فإن الهدف هو إنشاء الجملة المستهدفة Y من خلال إطار عمل Encoder-Decoder بالنظر إلى الجملة المدخلة X. يمكن أن تكون X وY نفس اللغة أو لغتين مختلفتين. يتكون كل من X وY من تسلسلات كلمات خاصة بهما:

كما يوحي الاسم، يقوم Encoder بترميز الجملة المدخلة X وتحويل الجملة المدخلة إلى تمثيل دلالي وسيط C من خلال التحويل غير الخطي:

بالنسبة لفك التشفير، فإن مهمته هي توليد الكلمة yi التي سيتم توليدها في الوقت i بناءً على التمثيل الدلالي الوسيط C للجملة X والمعلومات التاريخية التي تم إنشاؤها مسبقًا y1، y2….yi-1

يتم إنشاء كل yi بهذه الطريقة بدوره، لذلك يبدو الأمر كما لو أن النظام بأكمله يقوم بإنشاء الجملة المستهدفة Y بناءً على الجملة المدخلة X.

يعد هذا السيناريو مشكلة نموذجية في تطبيق إطار عمل التشفير وفك التشفير. كل ما عليك فعله هو تكوين النموذج المحدد لإطار عمل Encoder-Decoder، على سبيل المثال، يستخدم كل من Encoder وDecoder نموذج RNN.

يقوم المشفر-الفك بتوليد الرابط السفلي

كل ما عليك فعله هو العثور على كمية كبيرة من بيانات الأبيات لتدريب هذا النموذج، ثم يمكنك استخدام هذا النموذج، وإدخال الأبيات الأولى، وسوف تقوم الآلة تلقائيًا بإنشاء الأبيات الثانية.

من المفترض أن يعمل إطار عمل Encoder-Decoder بالإضافة إلى Attention على تحسين جودة السطر الثاني بشكل كبير. والسبب هو أن الأمر يتطلب التوازي الصارم. لذلك، عند إنشاء كلمة معينة في السطر الثاني، من المهم بلا شك العثور على الكلمة المقابلة في السطر الأول باعتبارها معلومات مرجعية أساسية للإنشاء.

على سبيل المثال، عندما يرى نموذج الانتباه الحرف "三" في البيت الأول، فإنه سوف يركز على الحرف "一" في البيت الثاني عند إنشاء الحرف المقابل. ينبغي أن يعلم أن الحرف المقابل يجب أن يكون حرفًا صينيًا رقميًا.

نموذج الاهتمام

وباستخدام Encoder-Decoder للقيام بذلك، ينبغي أن يكون من الممكن تعلم العلاقة المتناقضة بين الأحرف الصينية بشكل جيد، ولكن كيفية ضمان اتساق دلالات المقطع الثاني الناتج ليست بالضرورة حلاً جيدًا. ماذا يعني هذا؟ ما يعنيه هذا هو أنه عندما ترى الآلة السطر الأول من البيت "الريح والسحابة سيف الثلاثة أقدام"، فمن المرجح جدًا أن تأتي بالسطر التالي: "المطر والرياح سكين العشرة آلاف قدم". على المستوى الفردي، يبدو أن كل كلمة متطابقة بشكل جيد، ولكن ككل، لا يبدو أن الدلالات متناغمة. (ملاحظة: في الواقع، إذا ابتكرتَ هذا السطر الثاني، فهو بطوليٌّ حقًا، أليس كذلك؟ هذا في الواقع مرتبطٌ بحقيقة أن الناس يستخدمون خيالهم لدمج الكلمات المتتالية في سياقٍ منطقي.)

في الأساس، يتمكن Encoder-Decoder من تعلم نموذج اللغة أثناء مرحلة فك التشفير، ومن الواضح أن إدخال نموذج اللغة مفيد جدًا في توليد قابلية القراءة وتناسق اللغة للسطر الثاني.

ومع ذلك، إذا لم تكن بيانات التدريب كبيرة جدًا، فأعتقد أنه باستخدام عدد كبير من القصائد القديمة لتدريب نموذج لغة الشعر، في مرحلة توليد فك التشفير، يتم إنشاء العديد من الأحرف الصينية المرشحة المحتملة في كل عقدة زمنية t، ثم باستخدام نموذج اللغة هذا + البحث الشعاعي، يجب أن تكون الأبيات المولدة قادرة على ضمان اتساق دلالي معين.

عند إنشاء الأبيات الشعرية، توجد في الواقع مشكلة تتعلق بعروض الأحرف الصينية في الأبيات الشعرية العلوية والسفلية، والتي يمكن أيضًا فحصها وتصفيتها كخطوة معالجة لاحقة مماثلة لنموذج اللغة.

  • 2. استخدم RNN لإكمال

استخدم RNN لبناء نموذج لغوي للشعر القديم، ثم قم بإنشاء البيت الأول تلقائيًا من خلال نموذج RNN اللغوي هذا.

يقوم الشكل بإنشاء أبيات شعرية بشكل تلقائي بالكامل

بالإضافة إلى ذلك، لا تزال هناك مشكلة صغيرة متبقية بالنسبة للأبيات، وهي كيفية إنشاء الشريط الأفقي للأبيات. لأن الأبيات الشعرية بشكل عام تحتاج إلى أن تكون مصحوبة بشريط أفقي لتلخيص الموضوعات الرئيسية للأبيات الشعرية العلوية والسفلية.

الفكرة مشابهة فعليا. يمكن اعتبار الأبيات العلوية والسفلية ككل كمدخلات للمشفر، ويمكن استخدام المفكك لتوليد الشعار الأفقي. وهذا مشابه لفكرة استخدام Encoder-Decoder+Attention للتلخيص.

مراجع:

  • 1.https://blog.csdn.net/malefactor/article/details/51124732
  • استخدام نموذج التشفير وفك التشفير لتوليد الأبيات الشعرية تلقائيًا بقلم تشانغ جونلين
  • 2.https://mp.weixin.qq.com/s/ettmrvz0SMpdBd5HU1xhnw
  • "مسابقة أبيات الذكاء الاصطناعي الأولى" من حساب WeChat الرسمي: شيانغ زي ران
  • 3.https://duilian.msra.cn/app/couplet.aspx
  • أداة Microsoft Couplet
  • 4.https://ai.binwang.me/couplet/
  • نظام وانغ بين لمطابقة الأبيات التلقائية
  • 5. أداة كتابة الحسابات العامة على WeChat: AINLP