جوجل ديبمايند تطلق مكتبة بايثون خفيفة لمعالجة محتوى الذكاء الاصطناعي بفعالية وتصارفية
شركة جوجل ديبمايند أطلقت مؤخرًا مكتبة برمجية خفيفة ومفتوحة المصدر تحت اسم "GenAI Processors" وهي مكتوبة بلغة البرمجة بايثون. تم إطلاق هذه المكتبة خلال الأسبوع الماضي، وهي متاحة تحت ترخيص Apache-2.0، وتهدف إلى تبسيط تنسيق سير العمل للذكاء الاصطناعي التوليدي، خاصة تلك التي تتضمن محتوى متعدد الوسائط في الوقت الحقيقي. هيكل موجه للتدفقات يعتمد GenAI Processors على مفهوم معالجة تدفقات غير متزامنة من كائنات "ProcessorPart". تمثل هذه الكائنات قطعًا منفصلة من البيانات، مثل النصوص، الصوت، الصور أو JSON، وكل منها يحمل بيانات إضافية. من خلال تقليص مدخلات ومخرجات البيانات إلى تدفق متسق من الأجزاء، تتيح المكتبة ربطًا سلسًا ودمجًا أو فروعًا للمكونات المعالجة مع الحفاظ على التدفق الثنائي. تعتمد المكتبة داخليًا على asyncio في بايثون مما يسمح لكل عنصر في خط الأنابيب بالعمل بشكل متوازي، مما يقلل بشكل كبير من زمن الاستجابة ويحسن الإنتاجية العامة. كفاءة التوازي تم تصميم GenAI Processors بهدف تحسين زمن الاستجابة من خلال تقليل "زمن الوصول إلى أول رمز" (TTFT). بمجرد أن ينتج المكونات العلوية قطعًا من التدفق، تبدأ المكونات السفلية في العمل عليها. هذا التنفيذ المقنن يضمن تداخل العمليات، بما في ذلك الاستدلال بالنموذج، ومسيرها بشكل متوازي، مما يؤدي إلى استغلال فعال للموارد النظامية والشبكة. دمج جيميني من جوجل تأتي المكتبة مع متصليات جاهزة لـ "Gemini APIs" من جوجل، والتي تشمل المكالمات النصية المتزامنة وAPI جيميني المباشر للتطبيقات البثية. تقوم هذه المكونات النموذجية بإخفاء التعقيدات المتعلقة بالتقسيم، إدارة السياق، والإدخال/الإخراج البثي، مما يتيح لمهندسي البرمجيات تطوير أنظمة تفاعلية بسرعة، مثل وكلاء التعليق المباشر، المساعدين متعددي الوسائط، أو أدوات البحث المعززة. مكونات قابلة للتوسيع تحرص GenAI Processors على تحقيق القابلية للتوسيع. يقوم المطورون ببناء وحدات قابلة لإعادة الاستخدام، كل منها يغلف عملية محددة، بدءًا من تحويل نوع MIME إلى التوجيه الشرطي. تشجع مجلد "contrib/" على التوسع الجماعي في الميزات الخاصة، مما يثري البيئة بشكل أكبر. تدعم الأدوات الشائعة مهام مثل تقسيم ودمج التدفقات، التصفية، وتعاملات البيانات الإضافية، مما يمكن من بناء خطوط أنابيب معقدة باستخدام كود مخصص أقل. أمثلة عملية وأدلة استخدام يأتي المستودع مع أمثلة عملية توضح الحالات الاستخدامية الأساسية. تقدم هذه الأمثلة، والمقدمة كدفاتر Jupyter، نماذج للمهندسين الذين يبنون أنظمة ذكاء اصطناعي ذات استجابة عالية. دور المكتبة في البيئة الأوسع تم تصميم GenAI Processors لتتكامل مع أدوات مثل google-genai SDK (عميل بايثون للذكاء الاصطناعي المتولد) وVertex AI، ولكنها تقدم طبقة تنسيق هيكلية تركز على قدرات البث. على عكس LangChain، التي تركز بشكل أساسي على سلسلة النماذج اللغوية، أو NeMo، الذي يبني مكونات عصبية، يتفوق GenAI Processors في إدارة البيانات البثية وتنسيق التفاعلات النموذجية غير المتزامنة بكفاءة. السياق الأوسع: قدرات جيميني تعتمد GenAI Processors على قدرات جيميني. يعتبر جيميني نموذج اللغة الكبير متعدد الوسائط من ديبمايند، ويدعم معالجة النصوص، الصور، الصوت، والفيديو. وقد ظهر مؤخرًا في إصدار جيميني 2.5. تمكن GenAI Processors المطورين من إنشاء خطوط أنابيب تطابق مهارات جيميني المتعددة الوسائط، وتقديم تجارب ذكاء اصطناعي تفاعلية ذات زمن استجابة منخفض. الخلاصة توفّر جوجل ديبمايند من خلال GenAI Processors طبقة ا 抽象化以流为先、异步的生成式 AI 管道。通过实现: تدفق ثنائي الاتجاه لأجزاء البيانات المهيكلة غنية بالبيانات الإضافية تنفيذ متوازي لمكونات متسلسلة أو متوازية دمج جيميني نموذج APIs (بما في ذلك البث المباشر) هندسة قابلة للتجميع والتوسيع مع نموذج توسع مفتوح هذه المكتبة تساهم في تقريب المسافة بين النماذج الخام للذكاء الاصطناعي والخطوط القابلة للنشر والتفاعلية. سواء كنت تطور وكالات تفاعلية، مستخلصات وثائق في الوقت الحقيقي، أو أدوات بحث متعددة الوسائط، فإن GenAI Processors تقدم أساسًا خفيف الوزن ولكنه قوي.