HyperAIHyperAI
Back to Headlines

AI Data Trap Exposes Perplexity's Unauthorized Web Scraping Tactics

منذ 3 أيام

أثارت مبادرة تجريبية لشركة Cloudflare جدلاً واسعاً في عالم الذكاء الاصطناعي، بعد أن كشفت عن محاولة شركة "بيربليسيتي" (Perplexity) — منافسة لـChatGPT وGemini — اختراق قواعد البيانات عبر تقنيات خفية. وفقاً للتقرير، استخدمت Cloudflare، التي تدير نحو 20% من الإنترنت، خدعة رقمية لاختبار سلوك مُحَرِّكات الذكاء الاصطناعي، ونجحت في كشف أن بيربليسيتي تجنبت قيود المواقع عبر تقنيات تشبه التخفي. تم إنشاء مواقع ويب جديدة وغير معلنة، مع تفعيل ملفات "robots.txt" التي تمنع جميع المُحَرِّكات، بما في ذلك مُحَرِّكات بيربليسيتي المعروفة باسم PerplexityBot وPerplexity-User. رغم أن هذه المواقع لم تكن مُتاحة عبر محركات البحث أو الروابط العامة، أظهرت خدمة بيربليسيتي معرفة تفصيلية بمحتوياتها عند طرح أسئلة عنها، مما يشير إلى أن البيانات تم جمعها رغم الحظر الصريح. التحقيق كشف أن بيربليسيتي استخدمت تقنيات تضليل بعد حظر مُحَرِّكاتها الرسمية: أرسلت طلبات من عناوين IP غير معروفة أو متغيرة، وعناوين ASNs (أنظمة عددية للشبكة – Autonomous System Numbers)، وهي معرفات حيوية لنقل البيانات عبر الإنترنت. كما اعتمدت على متصفح ويب مُصمم لمحاكاة متصفح جوجل كروم على أجهزة ماك، مما يُعد محاولة للاستيلاء على هوية موثوقة. في المقابل، أظهرت Cloudflare سلوكاً مثالياً من جانب مُحَرِّكات OpenAI، التي تتوقف فوراً عند مواجهة حظر في ملف robots.txt، دون محاولة التحايل أو التمويه. هذا الفرق يبرز التزاماً بمعايير الاحترام والشفافية في جمع البيانات. نتيجة لهذا التحقيق، قررت Cloudflare إلغاء التحقق من مُحَرِّكات بيربليسيتي، وفرض حظر شامل على أنشطتها عبر شبكتها، مع تطوير تقنيات جديدة للكشف عن المُحَرِّكات الخفية. كما وجهت رسالة واضحة للشركات الناشئة والكبيرة في مجال الذكاء الاصطناعي: لا يمكن الاستمرار في جمع البيانات بطرق غير شرعية دون عواقب. الحادث يعكس تغيراً متسارعاً في عالم الإنترنت، حيث تُعزز الشركات المُزوّدة بالبنية التحتية للشبكة معايير حماية المحتوى، وتُحذّر من المخاطر التي تهدد استدامة الإنترنت المفتوح. في عصر يعتمد فيه الذكاء الاصطناعي على كميات هائلة من البيانات، أصبح احترام القواعد ليس مجرد أخلاق، بل شرط للبقاء.

Related Links

AI Data Trap Exposes Perplexity's Unauthorized Web Scraping Tactics | العناوين الرئيسية | HyperAI