منذ 6 أشهر

الملخص

يهدف التمييز بين الكيانات إلى تحديد السجلات في مجموعات بيانات متعددة تمثل الكيان نفسه في العالم الحقيقي. ومع ذلك، فإن مقارنة جميع السجلات عبر مجموعات البيانات قد تكون مكلفة من حيث الحساب، مما يؤدي إلى أوقات تشغيل طويلة. لخفض هذه الأوقات، تُبنى أنظمة التمييز بين الكيانات من جزأين: مُعَلِّق (Blocker) يُطبّق طريقة رياضية رخيصة من حيث الحساب لاختيار أزواج السجلات المرشحة، ثم مُطابق (Matcher) يُحدد لاحقًا الأزواج المتطابقة من هذه المجموعة باستخدام طرق أكثر تكلفة. تقدم هذه الورقة طريقة التجزئة SC-Block التي تستخدم التعلم المُوجَّه بالتباين (Supervised Contrastive Learning) لوضع السجلات في الفضاء المُضمَّن (Embedding Space)، واستخدام بحث الجيران الأقرب (Nearest Neighbor Search) لبناء مجموعة المرشحين. قمنا بمقارنة SC-Block مع ثمانية أساليب حديثة في التجزئة. ولربط وقت التدريب لـ SC-Block بخفض الوقت الكلي لتشغيل أنظمة التمييز بين الكيانات، قمنا بدمج SC-Block مع أربع طرق مطابقة لتكوين أنظمة كاملة. لقياس الوقت الكلي للتشغيل، حددنا مجموعات مرشحة تحقق نسبة 99.5% من الاستكمال الزوجي، ثم قمنا بتمريرها إلى المطابق. أظهرت النتائج أن SC-Block قادرة على إنشاء مجموعات مرشحة أصغر، وأن الأنظمة التي تستخدم SC-Block تنفذ بسرعة تصل إلى 1.5 إلى 2 مرة مقارنة بالأنظمة التي تستخدم مُعَلِّقات أخرى، دون التضحية بدرجة F1. غالبًا ما تُقيَّم المُعَلِّقات باستخدام مجموعات بيانات صغيرة نسبيًا، مما قد يؤدي إلى إغفال تأثيرات زمنية ناتجة عن حجم قاموس كبير جدًا. ولقياس الأوقات في بيئة أكثر تحديًا، نقدّم مجموعة بيانات معيارية جديدة تتطلب تجزئة عدد كبير جدًا من عروض المنتجات. على هذه المجموعة المعيارية الكبيرة، تعمل الأنظمة التي تستخدم SC-Block مع أفضل طريقة مطابقة على تسريع التشغيل بنسبة 8 أضعاف مقارنة بالأنظمة التي تستخدم مُعَلِّقًا آخر مع نفس المطابق، حيث ينخفض الوقت من 2.5 ساعة إلى 18 دقيقة، مما يُبرر بوضوح الـ 5 دقائق المطلوبة لتدريب SC-Block.

ملف PDF المصدر

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي

وحدات GPU جاهزة للعمل

أفضل الأسعار

ابدأ عرض الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا

سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين

مدعوم بواسطة MailChimp

الملخص

Alexander Brinkmann Roee Shraga Christian Bizer

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Alexander Brinkmann Roee Shraga Christian Bizer

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Alexander Brinkmann Roee Shraga Christian Bizer

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

ك- bloque: كتلة تعارضية مراقبة داخل خطوط أنابيب حل الهوية

Alexander Brinkmann Roee Shraga Christian Bizer

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

ك- bloque: كتلة تعارضية مراقبة داخل خطوط أنابيب حل الهوية

Alexander Brinkmann Roee Shraga Christian Bizer

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters

Command Palette

ك- bloque: كتلة تعارضية مراقبة داخل خطوط أنابيب حل الهوية

Alexander Brinkmann Roee Shraga Christian Bizer

الملخص

بناء الذكاء الاصطناعي بالذكاء الاصطناعي

HyperAI Newsletters