HyperAIHyperAI
منذ 19 أيام

التأثير: مجموعة بيانات كبيرة الحجم متكاملة متعددة الوسائط لتحليل وخلق براءات اختراع التصميم

{Sourav Medya, Sathya N. Ravi, Zhu Wang, Homaira Huda Shomee}
التأثير: مجموعة بيانات كبيرة الحجم متكاملة متعددة الوسائط لتحليل وخلق براءات اختراع التصميم
الملخص

في هذه الورقة، نقدم مجموعة البيانات IMPACT (مجموعة بيانات تحليل وخلق براءات اختراع متعددة الوسائط متكاملة لبراءات التصميم)، وهي مجموعة بيانات كبيرة متعددة الوسائط تحتوي على وصف دقيق لرسومات براءات التصميم. تضم مجموعة البيانات نصف مليون براءة تصميم، تشمل 3.61 مليون صورة، مع وصف مفصل لكل صورة، مستمدة من براءات اختراع صادرة عن مكتب براءات الاختراع والعلامات التجارية الأمريكي (USPTO) خلال فترة 16 سنة من عام 2007 إلى عام 2022. ندمج في مجموعة البيانات معلومات التعريف لكل طلب براءة اختراع مع وصف مفصل يتماشى مع وجهات نظر متعددة للتصميم. وعلى الرغم من أن براءات الاختراع نفسها تحتوي على مجموعة متنوعة من الرسومات التصميمية، والعناوين، والوصف من وجهات نظر متعددة، فإننا نلاحظ أنها تعاني من نقص في الوصف التفصيلي الضروري لأداء المهام متعددة الوسائط مثل التصنيف واسترجاع المعلومات. وتُعوّض مجموعة IMPACT هذه الفجوة، مما يزود الباحثين بالعناصر الأساسية لتنفيذ مجموعة واسعة من المهام متعددة الوسائط. تمتلك مجموعة البيانات إمكانات كبيرة لتقديم إلهام جديد للتصميم، ويمكن استخدامها بالتزامن مع نماذج متقدمة في الرؤية الحاسوبية. قمنا بإجراء تقييمات أولية على مجموعة البيانات في مهام تحليل براءات الاختراع الشهيرة مثل التصنيف واسترجاع المعلومات. وتشير نتائجنا إلى أن دمج الصور مع العناوين المولدة يحسن بشكل ملحوظ أداء النماذج المختلفة في المهام ذات الصلة. وبما أن براءات التصميم توفر فوائد متعددة لنموذج مهام جديدة، نقترح في هذا السياق مهامَين قياسيتين في مجال الرؤية الحاسوبية لم تُدرَس سابقًا في تحليل براءات الاختراع، كاتجاهات مستقبلية باستخدام IMPACT كمنصة معيارية، وهما: بناء الصور ثلاثية الأبعاد والإجابة على الأسئلة المرئية (VQA). ولتسهيل الأبحاث في هذه الاتجاهات، نُعلن عن جعل مجموعة بيانات IMPACT، بالإضافة إلى الشيفرة والنماذج المستخدمة في هذه الدراسة، متاحة للجمهور عبر الرابط التالي: https://github.com/AI4Patents/IMPACT.