Google تُطلق أداة بحث الملفات لتمكين الذكاء الاصطناعي من استكشاف البيانات الخاصة بك بسهولة
أعلنت جوجل عن أداة جديدة تُسمى "File Search" تُعدّ تطورًا كبيرًا في مجال تطبيقات الذكاء الاصطناعي المدعومة بالبيانات الخاصة، خصوصًا في سياق تطوير تطبيقات تعتمد على توليد المحتوى المدعوم باسترجاع (RAG). تُعد هذه الأداة حلاً مُدمجًا مباشرة في واجهة برمجة تطبيقات Gemini، مما يمكّن المطورين من تضمين معرفة مخصصة من مستندات شركتهم — مثل وثائق فنية، تقارير بحثية، أو دليل مستخدم — في استجابات نموذج الذكاء الاصطناعي، دون الحاجة إلى بناء أنظمة RAG معقدة من الصفر. تُعدّ File Search أداة مُدارة بالكامل، تُنفّذ كل مراحل معالجة البيانات تلقائيًا: استيراد الملفات، تقسيمها إلى أجزاء (chunking)، توليد تمثيلات متجهة (embedding) باستخدام نموذج gemini-embedding-001، وفهرستها لتمكين بحث دلالي دقيق. بخلاف الطرق التقليدية، لا يتعين على المطورين التفكير في بنية قواعد بيانات متجهة أو إدارة البنية التحتية. الأداة تدعم مجموعة واسعة من التنسيقات، بما في ذلك PDF، DOCX، TXT، JSON، وملفات برمجية، مما يسمح ببناء قاعدة معرفة شاملة من مصادر موجودة بالفعل. أحد الميزات البارزة هو دعم التوثيق التلقائي (Citations)، حيث تُضمن في إجابة النموذج معلومات دقيقة عن مصدر كل معلومة، مما يعزز الشفافية والموثوقية — ميزة حاسمة في التطبيقات المؤسسية. كما تُعدّ التكلفة منخفضة جدًا: التخزين وتمثيل الاستفسارات مجاني، بينما تُحسب تكلفة تمثيل الملفات المُحَمَّلة بسعر يبدأ من 0.15 دولار لكل مليون رمز. في مثال تطبيقي، تم تحميل دليل هاتف سامسونج S25 (180 صفحة) إلى أداة File Search، ثم طُلب من نموذج Gemini 2.5 Flash الإجابة عن سؤال حول النماذج المدعومة. أجاب النموذج بدقة بقائمة الموديلات، بما في ذلك Galaxy S25 Ultra وS25 Edge، مع تأكيد دقيق من الملف الأصلي. كما نجح في استخراج إجابة مفصلة حول كيفية تفعيل إيقاف الشاشة تلقائيًا، رغم أن التفاصيل كانت موزعة في الصفحة 156. تُتيح الأداة أيضًا التحكم في عملية التقسيم عبر مُعلّم chunking_config، حيث يمكن ضبط حجم الأجزاء (مثلاً 200 رمز) وعدد الرموز المتداخلة (20 رمز) لضبط دقة الاسترجاع. كما تُمكن المطور من حذف مخازن الملفات برمجيًا عند انتهاء الاستخدام، مع ملاحظة أن الملفات الأصلية تُحذف تلقائيًا بعد 48 ساعة، لكن التمثيلات المتجهة تُبقي للاستفادة المستمرة. على عكس أدوات جوجل الأخرى مثل Context Grounding وLangExtract، تُعد File Search النظام الحقيقي لـ RAG، لأنها تُخزّن التمثيلات المتجهة بشكل دائم، مما يسمح بالاستعلام المتكرر دون إعادة تحميل الملفات. بينما تُستخدم الأدوات الأخرى لربط الإجابات بمصادر حية (مثل بحث جوجل) أو استخراج بيانات منظمة من نصوص غير منظمة. باختصار، تُقدّم File Search حلاً مدمجًا، مُبسطًا، وفعّالًا لدمج المعرفة الخاصة في تطبيقات الذكاء الاصطناعي، مما يُقلل من عبء التكامل التقني ويعزز دقة وموثوقية الإجابات.
