HyperAIHyperAI
منذ 2 أشهر

ビジョン-言語トランスフォーマーと参照セグメンテーションのクエリ生成 请注意,您要求的是简体阿拉伯语,但这里提供的翻译是日语。目前没有“简体阿拉伯语”这一说法,阿拉伯语只有一种书写形式。如果您需要阿拉伯语翻译,请告知我。 变压器视觉-语言和引用分割的查询生成 这是中文原文的直译,但似乎不符合您的要求。请确认是否需要阿拉伯语翻译。 المحول البصري-اللغوي وتكوين الاستعلامات للتقسيم المرجعي 这是您所需内容的阿拉伯语翻译。希望对您有所帮助。

Ding, Henghui ; Liu, Chang ; Wang, Suchen ; Jiang, Xudong
ビジョン-言語トランスフォーマーと参照セグメンテーションのクエリ生成
请注意,您要求的是简体阿拉伯语,但这里提供的翻译是日语。目前没有“简体阿拉伯语”这一说法,阿拉伯语只有一种书写形式。如果您需要阿拉伯语翻译,请告知我。
变压器视觉-语言和引用分割的查询生成
这是中文原文的直译,但似乎不符合您的要求。请确认是否需要阿拉伯语翻译。
المحول البصري-اللغوي وتكوين الاستعلامات للتقسيم المرجعي
这是您所需内容的阿拉伯语翻译。希望对您有所帮助。
الملخص

في هذا العمل، نتناول المهمة الصعبة لتقسيم الإشارة (referring segmentation). عادةً ما يشير التعبير الاستعلامي في تقسيم الإشارة إلى الكائن المستهدف من خلال وصف علاقته بالكائنات الأخرى. لذلك، للعثور على الكائن المستهدف بين جميع الحالات في الصورة، يجب أن يكون للنموذج فهم شامل للصورة بأكملها. لتحقيق هذا الهدف، نعيد صياغة تقسيم الإشارة كمشكلة انتباه مباشرة: العثور على المنطقة في الصورة التي يتم فيها الانتباه بشكل أكبر إلى التعبير الاستعلامي باللغة. نقدم شبكات الترانسفورمر (transformer) والانتباه متعدد الرؤوس (multi-head attention) لبناء شبكة ذات هندسة آلية انتباه مُشفِّر-مُفكِّك (encoder-decoder) تُستخدَم لاستعلام الصورة المعطاة باستخدام التعبير اللغوي. بالإضافة إلى ذلك، نقترح وحدة إنشاء الاستعلامات (Query Generation Module)، والتي تنتج مجموعات متعددة من الاستعلامات بوزن انتباه مختلف تمثل الفهم المتنوع للتعبير اللغوي من جوانب مختلفة. وفي الوقت نفسه، للعثور على أفضل طريقة من هذه الفهمات المتنوعة بناءً على الدلائل البصرية، نقترح أيضًا وحدة توازن الاستعلامات (Query Balance Module) لاختيار الخصائص الناتجة لهذه الاستعلامات بشكل تكيفي لتحقيق إنتاج قناع أفضل. دون أي تعقيدات زائدة، يحقق نهجنا أداءً رائدًا جديدًا باستمرار على ثلاثة مجموعات بيانات لتقسيم الإشارة هي RefCOCO وRefCOCO+ وG-Ref. يمكن الوصول إلى شفرتنا المصدرية عبر الرابط https://github.com/henghuiding/Vision-Language-Transformer.

ビジョン-言語トランスフォーマーと参照セグメンテーションのクエリ生成 请注意,您要求的是简体阿拉伯语,但这里提供的翻译是日语。目前没有“简体阿拉伯语”这一说法,阿拉伯语只有一种书写形式。如果您需要阿拉伯语翻译,请告知我。 变压器视觉-语言和引用分割的查询生成 这是中文原文的直译,但似乎不符合您的要求。请确认是否需要阿拉伯语翻译。 المحول البصري-اللغوي وتكوين الاستعلامات للتقسيم المرجعي 这是您所需内容的阿拉伯语翻译。希望对您有所帮助。 | أحدث الأوراق البحثية | HyperAI