عُدّت الشبكة العنكبوتية قاعدة بيانات بـ Exa: محرك بحث يعيد السحر للمعلومات على الإنترنت
مرحبًا بكم في هاكير نيوز! نحن ويل وجيف من Exa (https://exa.ai). لقد أطلقنا مؤخرًا خدمة Exa Websets، وهي محرك بحث مدعوم بتقنية التمثيلات المتجهة (embeddings) مصمم للحصول على النتائج الدقيقة تمامًا لما تتطلبه. يمكنك الحصول على نتائج دقيقة لاستفسارات معقدة مثل "جميع الشركات الناشئة التي تعمل على أدوات مفتوحة المصدر للمطورين ومقرها في سان فرانسيسكو، وتأسست بين عامي 2021 و2025". يمكنك مشاهدة العرض التوضيحي هنا: https://youtu.be/Unt8hJmCxd4 بدأنا العمل على Exa بسبب إحباطنا من تدهور جودة البحث عبر الإنترنت على مر الزمن، بينما تتطور تقنيات النماذج اللغوية الكبيرة (LLMs) بشكل مستمر. كان الإنترنت في السابق يشعر وكأنه بوابة سحرية للمعلومات، لكنه لم يعد كذلك عندما تجد نفسك دائمًا أمام محتوى مُحسَّن لمحركات البحث (SEO) ومقالات مغرِّرة. يتجه Websets في اتجاه معاكس. لكل بحث، نقوم بتنفيذ عشرات عمليات البحث المتجهي على قاعدة بيانات Exa المتجهة للويب لتحديد المرشحين الجيدين، ثم نقوم بتشغيل سير عمل ذكي على كل نتيجة للتحقق من أنها تتطابق تمامًا مع ما طلبته. تتميز نتائج Websets بالدقة لسببين رئيسيين: نقوم بتدريب نماذج تمثيلية مخصصة لخوارزمية بحثنا الرئيسية، بدلاً من الخوارزميات التقليدية القائمة على مطابقة الكلمات المفتاحية. يتم تدريب نماذجنا المتجهة خصيصًا لإرجاع نوع الكيان الذي تبحث عنه. في الممارسة العملية، هذا يعني أن إذا بحثت عن "الشركات الناشئة العاملة في النانوتكنولوجيا"، فإن محركات البحث القائمة على الكلمات المفتاحية تعود بقوائم مقالات حول الشركات الناشئة في مجال النانوتكنولوجيا لأن هذه القوائم تتطابق مع الكلمات المفتاحية في الاستفسار. ومع ذلك، تعيد نماذجنا المتجهة صفحات الشركات الناشئة نفسها لأنها تتطابق مع معنى الاستفسار. تقدم النماذج اللغوية الكبيرة (LLMs) الذكاء اللازم للتحقق من كل نتيجة. يتم دعم كل نتيجة ومعلومة بالمرجعيات التي استخدمناها للتحقق من أن النتيجة تتطابق بالفعل مع معايير البحث الخاصة بك. لهذا السبب، قد يستغرق Websets دقائق أو حتى ساعات للعمل، اعتمادًا على استفسارك والعديد من النتائج التي تطلبها. بالنسبة لاستفسارات قيمة، نعتقد أن هذا الأمر يستحق الوقت. يُشار أيضًا إلى أن نتائج Websets تكون على شكل جداول وليس قوائم. يمكنك إضافة أعمدة "تعزيز" للحصول على معلومات إضافية حول كل نتيجة، مثل "عدد الموظفين" أو "هل لدى المؤلف مدونة؟"، وستحمل الخلايا هذه المعلومات بشكل غير متزامن. هذا التنسيق الجدول يأمل أن يجعل الويب يبدو أكثر كقاعدة بيانات. إليك بعض أمثلة الاستفسارات التي تعمل مع Websets: "المدونات الرياضية التي أنشأها معلمون من خارج الولايات المتحدة": https://websets.exa.ai/cma1oz9xf007sis0ipzxgbamn "ورقة بحثية تتناول طرق تجنب مشكلة الانتباه O(n^2) في المتغيرات (transformers)، حيث يبدأ اسم أحد المؤلفين الأول بأحرف 'A'، 'B'، 'S'، أو 'T'، وقد كُتبت بين عامي 2018 و2022": https://websets.exa.ai/cm7dpml8c001ylnymum4sp11h "شركات الرعاية الصحية في الولايات المتحدة، التي لديها أكثر من 100 موظف ومؤسس فني": https://websets.exa.ai/cm6lc0dlk004ilecmzej76qx2 "جميع المهندسين البرمجيين في منطقة خليج سان فرانسيسكو، الذين لديهم خبرة في الشركات الناشئة ويعرفون Rust ونشر他们会内容之前": https://youtu.be/knjrlm1aibQ يمكنك تجربة خدمتنا في https://websets.exa.ai/ وتوثيق API متاح في https://docs.exa.ai/websets. نتطلع إلى استلام تعليقاتكم وملاحظاتكم!