HyperAIHyperAI
Back to Headlines

تصحيح ربط البيانات privية: EnronQA يُقدم معيارًا جديدًا لتعزيز الاستدلال الشخصي في أنظمة RAG

منذ 2 أشهر

في السنوات الأخيرة، أصبحت تقنية الاسترجاع المُعزز للإنتاج (RAG) من أكثر الأساليب شعبية لمُدمجة السياقات الغنية بالمعرفة في النماذج اللغوية الكبيرة (LLM). هذه التقنية تتميز بقدرتها على إدخال سياق محلي أثناء الاستدلال دون الحاجة إلى تحمل تكاليف التعديل الدقيق للنماذج أو المخاطر المتعلقة بتسرب البيانات. لذا، فإن RAG تعتبر أساساً لكثير من التطبيقات اللغوية المُستخدمة في المؤسسات، حيث تتيح لهذه الشركات تعزيز فهم النماذج اللغوية من خلال استخدام الوثائق الخاصة بعملائهم. ومع ذلك، فإن معظم المعايير الحالية التي تُستخدم لتقييم وتحسين أنابيب RAG تعتمد بشكل أساسي على بيانات عامة مثل مقالات ويكيبيديا أو مواقع الويب العامة، ونادراً ما تشمل سياقات شخصية. هذا القصور يمكن أن يؤدي إلى عدم دقة النتائج عند تطبيق هذه النماذج على بيانات خاصة. من أجل تجاوز هذا التحدي وتوسيع نطاق تطبيقات RAG الشخصية والخاصة، تم إطلاق مجموعة بيانات EnronQA. هذه المجموعة تتكون من 103,638 رسالة بريد إلكتروني تعود لـ150 مستخدمًا مختلفًا من شركة إنرون، بالإضافة إلى 528,304 زوج من الأسئلة والإجابات المستخرجة من هذه الرسائل. تم تصميم EnronQA لتوفير دعم أفضل لمعايير تقييم أنابيب RAG التي تعتمد على البيانات الخاصة، مما يسمح بإجراء تجارب على ضبط الإعدادات الشخصية باستخدام بيانات حقيقية. في دراسة مُرتبطة بهذا المشروع، تم استخدام EnronQA لاستكشاف التوازن بين الذاكرة والاسترجاع في معالجة الوثائق الخاصة. الهدف هو فهم كيف يمكن للنماذج اللغوية الكبيرة أن تستفيد من بيانات المستخدم الشخصية دون المساس بخصوصيتها، وكيف يمكن تحسين كفاءة الاسترجاع للمعلومات المُلائمة لكل مستخدم على حدة. إن هذه الدراسة تعكس أهمية تطوير معايير مُستندة إلى بيانات حقيقية لضمان أداء أفضل وأنسب للتطبيقات اللغوية في البيئات المؤسسية والشخصية. كما أنها تسليط الضوء على القدرات المتزايدة للنماذج اللغوية في تحقيق التخصيص والحماية في الوقت نفسه، مما يفتح آفاقًا جديدة في مجال الذكاء الصناعي وتطبيقاته العملية.

Related Links

تصحيح ربط البيانات privية: EnronQA يُقدم معيارًا جديدًا لتعزيز الاستدلال الشخصي في أنظمة RAG | العناوين الرئيسية | HyperAI