HyperAI
Back to Headlines

كشف OpenAI عن خفايا عمل ChatGPT: كيف يتم التعامل مع الطلبات البحثية بواسطةthree نماذج مختلفة

منذ 8 أيام

مع إطلاق واجهة برمجة التطبيقات (API) الخاصة بـ OpenAI لبحث العميق، كشفت الشركة أيضًا عن بعض العمليات الداخلية لـ ChatGPT. هذه الوثائق توضح أن العديد من الأنشطة تجري خلف الكواليس، مما يعزز فكرة أن واجهة برمجة التطبيقات تُعتبر حقًا صندوقًا أسود، حيث تكون الوظائف الأساسية غير معروفة للمستخدمين. العديد من الدراسات أشارت إلى كيف يمكن أن تتغير وتتبدد النماذج وراء واجهات برمجة التطبيقات التجارية، مما يجعل المستخدمين تحت رحمة مزودي النماذج. كشفت هذه النشرة عن سلسلة الخطوات التي تتم عند إجراء استعلام بحث عميق عبر ChatGPT، مما يوفر رؤية لما يحدث داخل النظام. الفكرة الأساسية وراء واجهة ChatGPT الرسومية هي تبسيط التعقيد وإظهار واجهة استخدام بسيطة للمستخدمين. ومع ذلك، من المثير للاهتمام رؤية كيف يتم تنفيذ ثلاث دعوات لنماذج لغوية مختلفة ضمن النظام. يستخدم ChatGPT نموذجًا مساعدًا، مثل GPT-4.1، لتحديد النوايا وتجميع التفاصيل حول التفضيلات أو الأهداف قبل بدء البحث. هذا الخطوة تُخصِّص عمليات البحث على الإنترنت للحصول على نتائج أكثر صلة. ولكن، يتم حذف هذه الخطوة من واجهة برمجة التطبيقات، مما يتيح للمطور تحديد مدى تخصيص مسار العمل. ثم يستخدم نموذج إعادة صياغة الدوافع نموذجًا آخر خفيف الوزن، مثل GPT-4.1 أيضًا، لتوسيع أو تحديد استعلامات المستخدم قبل نقلها إلى النموذج البحثي الرئيسي. هذا يوضح بشكل كبير التعقيد الذي يقع تحت الغطاء. كما يظهر في الصورة أدناه، فإن آليات عمل ChatGPT في البحث العميق تُظهر مدى التعقيد الداخلي للنظام، مما يبرز مبدأً مهمًا: التعقيد يجب أن يقع في مكان ما، إما يتم تقديمه للمستخدم ليُفككه ويكتشفه، أو يتم إخفاؤه تحت الغطاء وراء واجهة المستخدم. إن إدارة هذا التعقيد تُلقى على عاتق المطور لإدارة تجربة المستخدم بدلاً منه. يجب مراعاة أن هناك ثلاثة نماذج لغوية متورطة في العملية: واحد لحل التباس النوايا وتوضيحها، والثاني لتحسين الدوافع للنموذج البحثي، والثالث هو النموذج البحثي الرئيسي نفسه. يمكن أن يتعلم الكثير من هذا النهج، والذي يُظهر أن نموذجًا واحدًا ليس دائمًا (وفي معظم الحالات) الحل الأمثل. بدلاً من ذلك، قد يكون استخدام عدة نماذج أصغر وأقل قدرة أكثر فعالية. كما توضح الصورة أدناه، عرضت شركة NVIDIA نهجًا حيث يتم تدريب نموذج لغوي على تحديد الأداة المناسبة لاستخدامها في كل خطوة أو خطوة فرعية. هذا يُشير إلى كيفية تحسين الكفاءة وتخصيص الاستجابات من خلال تقسيم المهام بين عدة نماذج، مما يزيد من فعالية النظام ككل.

Related Links