بناء وكلاء بحث متخصصين لاستخلاص رؤى تقنية دقيقة
لبناء وكيل بحث متخصص في مجال التكنولوجيا، يتجاوز ما يمكن تحقيقه عبر نماذج مثل ChatGPT، يتطلب توظيف بنية معقدة تدمج مصادر بيانات مُعدّة مسبقًا، وتدفقًا مُهيكلًا، وتقنيات تسلسل الأوامر (prompt chaining). الفكرة ليست مجرد طلب "أوجد لي أحدث اتجاهات التكنولوجيا"، بل تصميم نظام قادر على استخلاص أنماط حقيقية من ملايين النصوص، وتصفية المعلومات حسب شخصية المستخدم، وتقديم تقارير قابلة للتنفيذ. النقطة المحورية هنا هي وجود مصدر بيانات مخصص ومُهيكل. بدلاً من الاعتماد على بحث عشوائي عبر الإنترنت، يُستخدم نظام يُدخل آلاف المقالات والمنشورات من منتديات التكنولوجيا يوميًا، ويُحللها بمساعدة نماذج صغيرة لاستخراج الكلمات المفتاحية، وتصنيفها حسب الفئة، وتحليل مشاعر النصوص. يُخزن هذا التحليل في قاعدة بيانات مُعدّة مسبقًا، ويُستخدم كمصدر موثوق. لكل كلمة مفتاحية، يُنشئ النظام نقطة نهاية (endpoint) تُستخرج "حقائق" مرتبطة بها بناءً على التفاعل، ثم تُعالج هذه الحقائق بسلسلة من النماذج الصغيرة لاختيار الأهم، قبل أن تُلخّصها نموذج لغوي كبير (LLM) مع الحفاظ على مصادرها. الميزة الأهم: التخزين المؤقت (caching). أول طلب لكلمة مفتاحية قد يستغرق دقيقة، لكن الطلبات اللاحقة تُنفذ خلال ميلي ثانية، مما يقلل التكلفة إلى بضعة سنتات لكل تقرير. يُبنى الوكيل على تدفق مزدوج: أولاً، إعداد الملف الشخصي، حيث يُطلب من المستخدم تحديد هويته (مثل: مدير تسويق، مطور، أو مدير تنفيذي). يُستخدم نموذج لغوي لتحويل هذا الوصف إلى مخرجات منظمة (JSON) تتضمن الفئات الرئيسية والثانوية، والكلمات المفتاحية (بحد أقصى 6)، وفترة الزمن، ونوع الملخص (موجز أو مفصل). هذه المخرجات تُخزن في قاعدة بيانات مثل MongoDB، وتعمل كمفتاح لاستخراج البيانات المناسبة. في المرحلة الثانية، عند طلب التقرير (مثل عبر أمر /news)، يُسترجع الملف الشخصي، ويُستخرج قائمة بالكلمات المفتاحية والاتجاهات الأكثر تفاعلًا خلال الفترة المحددة. تُستدعى نقطة النهاية لجمع الحقائق المُخزّنة لكل كلمة، وتُعالج بشكل متوازٍ لتسريع العملية. بعد دمج النتائج وحذف التكرارات، يُستخدم تسلسل من نماذج لغوية: الأول يحدد 5-7 مواضيع رئيسية ويرتبها حسب الصلة بالمستخدم، والثاني يُولّد ملخصين (موجزًا وتفصيليًا) مع عنوان مناسب. المرحلة الأخيرة، الأكثر استهلاكًا للوقت، تستخدم نموذجًا متقدمًا (مثل GPT-5) لبناء التقرير النهائي، حيث يُعالج النموذج البيانات مع الحفاظ على التوثيق. يُمكن تقليل التكلفة أو التأخير بتبديل النموذج، لكن النموذج الأقوى يُنتج نتائج أكثر دقة وانسجامًا. النظام لا يعتمد على قدرات LLM فقط، بل على هندسة برمجية دقيقة: التحكم في التدفق، التحقق من المخرجات، التخزين المؤقت، واستخدام نماذج صغيرة للوظائف البسيطة. هذا يُظهر أن الذكاء الاصطناعي لا يحل محل المهندسين، بل يُكملهم. النموذج يمكن تجربته عبر قناة ديسكورد، أو بناؤه من الكود المتوفر على GitHub. الاستنتاج: لبناء وكيل فعّال، لا يكفي التحدث مع نموذج لغوي، بل يحتاج إلى بنية بيانات قوية، تدفق مُهيكل، وتصميم هندسي دقيق. هذه هي المفتاح لتحويل الذكاء الاصطناعي من أداة عامة إلى أداة بحث متخصصة وفعّالة.
