HyperAIHyperAI

Command Palette

Search for a command to run...

التعرف على الحالة: تسمية الأدوار الشكلية البصرية لفهم الصور

Luke Zettlemoyer Ali Farhadi Mark Yatskar

الملخص

يقدّم هذا البحث مفهوم التعرف على الحالة، وهو مشكلة توليد ملخّص موجز للحالة التي تُمثّلها صورة ما، ويشمل: (1) النشاط الرئيسي (مثل قصّ شيء ما)، (2) المشاركين في النشاط، مثل الأشخاص، والأشياء، والمواد، والأماكن (مثل رجل، مقص، خروف، صوف، وحقل)، والأهم من ذلك (3) الأدوار التي يلعبها هؤلاء المشاركون في النشاط (مثل أن الرجل هو من يقوم بالقص، والمُقص أداة يستخدمها، والصوف هو ما يُقص من الخروف، والقص يحدث في حقل). ونستخدم FrameNet، وهو قاموس للأفعال والأدوار طوّرته علماء اللغة، لتحديد فضاء واسع من الحالات الممكنة، وجمعنا مجموعة بيانات كبيرة تضم أكثر من 500 نشاط، و1700 دور، و11000 كائن، و125000 صورة، و200000 حالة فريدة. كما نقدّم نماذج أساسية للتنبؤ المهيكل، ونُظهر أن التنبؤ المُوجّه بالحالة في الصور ذات البُعد النشطي يتفوّق على التعرف المستقل على الأشياء والأنشطة.


بناء الذكاء الاصطناعي بالذكاء الاصطناعي

من الفكرة إلى الإطلاق — سرّع تطوير الذكاء الاصطناعي الخاص بك مع المساعدة البرمجية المجانية بالذكاء الاصطناعي، وبيئة جاهزة للاستخدام، وأفضل أسعار لوحدات معالجة الرسومات.

البرمجة التعاونية باستخدام الذكاء الاصطناعي
وحدات GPU جاهزة للعمل
أفضل الأسعار

HyperAI Newsletters

اشترك في آخر تحديثاتنا
سنرسل لك أحدث التحديثات الأسبوعية إلى بريدك الإلكتروني في الساعة التاسعة من صباح كل يوم اثنين
مدعوم بواسطة MailChimp
التعرف على الحالة: تسمية الأدوار الشكلية البصرية لفهم الصور | مستندات | HyperAI