HyperAI
Back to Headlines

فهم اللغة الطبيعية دون تijiء السمات الإنسانية: وجهة نظر حاسوبية نقية للنماذج اللغوية الكبيرة

منذ 3 أيام

نظرة غير أنسنة للنماذج اللغوية الكبيرة (LLMs) فضاء الكلمات في مجال النماذج اللغوية الكبيرة (LLMs)، يتم تحويل الكلمات الفردية (أو العلامات) إلى متجهات في فضاء (\mathbb{R}^n). يمكننا تخيل هذا الفضاء كمنطقة تتحرك فيها الكلمات واحدة تلو الأخرى، مما يشكل مسارًا قد يكون معقدًا ومتشابكًا. إذا كنت قد لعبت لعبة "الثعبان" (Snake)، فتخيل شيئًا مشابهًا، ولكن في فضاء ذو أبعاد عالية جدًا - تتحرك للأمام في الفضاء مع قطع الذيل بشكل مستمر. تعلم الخريطة تحصل هذه الخريطة من خلال تدريب النموذج على تقليد النصوص البشرية. لهذا الغرض، نستخدم جميع النصوص البشرية التي يمكن الحصول عليها، بالإضافة إلى مجموعات نصوص كتبها خبراء بشر في موضوعات معينة، وبعض النصوص التي تم إنشاؤها secara تلقائيًا في المجالات التي يمكن فيها إنشاء وتحقق النصوص تلقائيًا. المسارات التي يجب تجنبها المسارات التي تولدها النماذج اللغوية الكبيرة تشبه كثيرًا مسارات الجاذبات الغريبة في الأنظمة الديناميكية - مسارات معقدة ومتشابكة ولكنها مرتبة بشكل ما. ومع ذلك، هناك بعض المسارات التي يجب تجنبها، مثل تلك التي قد تكون ضارة أو مضللة. فائدة LLMs المفاجئة نحن على منحنى تحسين حاد، وأتوقع أن يواصل عدد المشكلات التي لا يمكن حلها حاليًا بال modelos هذه زيادة لفترة من الوقت. تقدم النماذج اللغوية الكبيرة فائدة كبيرة في العديد من التطبيقات، مثل الكتابة الإبداعية، الترجمة، والمساعدة في البحث العلمي. أين تفقد الأنسنة فائدتها تبدأ مشكلتي عندما يُنسب للنماذج اللغوية الكبيرة خصائص مثل "الوعي" أو "الأخلاق" أو "القيم" أو "المبادئ". نتحدث هنا عن معادلة تكرارية كبيرة تنتج كلمة جديدة وتتوقف عن الإنتاج إذا لم نستمر في تشغيلها. بالنسبة لي، السؤال عما إذا كان هذا الجهاز سيستيقظ هو أمر غريب تمامًا كما لو كنت أسأل عالم الأرصاد الجوية إذا كان يخشى أن يستيقظ حسابه العددي للأرصاد الجوية. أنا مذهول من أن المناقشات حول الذكاء الاصطناعي تظل تتعامل مع وظيفة لتقدير تسلسل الكلمات وكأنها شيء يشبه الإنسان. تصريحات مثل "قد يصبح وكيل الذكاء الاصطناعي تهديدًا داخليًا لذا يجب رصد تصرفاته" هي في الوقت نفسه متوقعة (لديك مولد تسلسل عشوائي متصل بواجهة المستخدم، أي شيء يمكن أن يحدث!) ومذهلة (تحدث كما لو كنت تعتقد أن النرد الذي تلعب به لديه عقله الخاص ويمكنه قرار المؤامرة ضدك). بدلاً من قول "لا يمكننا ضمان عدم توليد أي تسلسل ضار بواسطة وظيفتنا، جزئيًا لأننا لا نعرف كيف نحدد ونعد التسلسلات الضارة"، نتحدث عن "سلوكيات"، و"قيود أخلاقية"، و"أفعال ضارة لتحقيق أهدافها". كل هذه المفاهيم هي مفاهيم أنسانية لا تتناسب، في رأيي، مع الوظائف أو الأشياء الرياضية الأخرى. واستخدامها يخلط المناقشة وتفكيرنا في ما نقوم به عند إنشاء وتحليل وإقحام وتتبع النماذج اللغوية الكبيرة. لماذا يميل العديد من الخبراء في الذكاء الاصطناعي إلى الأنسنة ربما أنا أقاتل الرياح، أو بدقة أكبر، أنا أتعامل مع تحيز اختياري: عدد كبير من الخبراء الحاليين في الذكاء الاصطناعي اختاروا هذا المسار الوظيفي بناءً على اعتقادهم بأنهم قد يكونون من بين الذين يصلون إلى الذكاء الاصطناعي العام (AGI) - أي "إنشاء إله"، إنشاء شيء يشبه الحياة أو أفضل من البشر. يمكنك أن تكون أكثر استعدادًا لاختيار هذا المسار الوظيفي إذا كنت تعتقد أنه ممكن، وأن الأساليب الحالية قد تقودك إليه. ربما أنا أسأل الناس أن "يتخلوا عن الاعتقاد الذي بنوا حياتهم حوله" عندما أطالب بوقف الأنسنة للنماذج اللغوية الكبيرة، وهو ما لن ينجح. لماذا أعتقد أن الوعي البشري ليس مماثلًا للنماذج اللغوية الكبيرة هذه النقاط قد تكون مزعجة فلسفيًا، ولكن في رؤيتي للعالم، البشر هم أشياء مختلفة تمامًا عن وظيفة ((\mathbb{R}^n)^c \mapsto (\mathbb{R}^n)^c). على مدى مئات الملايين من السنين، أنتجت الطبيعة نسخًا جديدة، ونجت فقط أعداد قليلة منها. عملية التفكير البشرية هي عملية غير مفهومة جيدًا، وتتضمن عددًا هائلًا من الخلايا العصبية، مدخلات ذات نطاق ترددي عالٍ للغاية، مزيجًا معقدًا من الهرمونات، مراقبة مستمرة لمستويات الطاقة، وملايين السنين من ضغوط الانتقاء القاسية. نحن نفهم أساسًا شيئًا قليلًا عن هذه العملية. بخلاف النموذج اللغوي الكبير، إذا كان لدي إنسان وسلاسل كلمات معينة، لا يمكنني البدء في وضع احتمالات حول "هل سيولد هذا الإنسان هذه السلسلة؟". لذا فإن النظر إلى أي مفهوم بشري مثل الأخلاق، الرغبة في النجاة، أو الخوف، وكأنه ينطبق على نموذج لغوي كبير يبدو غريبًا تمامًا كما لو كنا نناقش مشاعر حساب عددي للأرصاد الجوية. القضايا الحقيقية الفئة الوظيفية التي تمثلها النماذج اللغوية الكبيرة الحديثة هي مفيدة للغاية. حتى لو لم نصل أبدًا إلى الذكاء الاصطناعي العام وقمنا فقط بإدخال الحالة الحالية للتكنولوجيا في كل مكان يمكن أن تكون فيه مفيدة، سنحصل على عالم مختلف تمامًا. قد تصبح النماذج اللغوية الكبيرة مثيرة للتأثير بنفس درجة التحول الكهربائي في العالم. تقييم الحدث من قبل المختصين يؤكد العديد من المختصين في الذكاء الاصطناعي أن الأنسنة للنماذج اللغوية الكبيرة يمكن أن تعيق فهمها الحقيقي وتزيد من التخوفات العامة من التكنولوجيا. يرى البعض أن التركيز على المفاهيم البشرية مثل الأخلاق والوعي يشتت الانتباه عن القضايا الفنية الحقيقية، مثل تحسين الدقة وتقليل الأخطاء الضارة. في الوقت نفسه، تستمر الشركات الكبرى مثل Google وMicrosoft في الاستثمار بكثافة في تطوير هذه النماذج، آملة في تحقيق تقدم كبير في مجالات مثل الترجمة الآلية والكتابة الإبداعية والبحث العلمي.

Related Links