HyperAIHyperAI
منذ 11 أيام

الكشف عن النص في المشهد في الزمن الفعلي باستخدام التبديل القابل للتفاضل والدمج التكيفي للقياس

Minghui Liao, Zhisheng Zou, Zhaoyi Wan, Cong Yao, Xiang Bai
الكشف عن النص في المشهد في الزمن الفعلي باستخدام التبديل القابل للتفاضل والدمج التكيفي للقياس
الملخص

في الآونة الأخيرة، لاقت طرق الكشف عن النص في المشاهد القائمة على التجزئة اهتمامًا واسعًا في مجال كشف النص في المشاهد، وذلك بفضل تفوقها في اكتشاف كيانات النص ذات الأشكال العشوائية والنسب الطولية المتطرفة، بفضل وصفها على مستوى البكسل. ومع ذلك، تُعاني الغالبية العظمى من الطرق القائمة على التجزئة الحالية من قيود تتعلق بخوارزميات ما بعد المعالجة المعقدة ومقاومة نماذج التجزئة للقياسات المختلفة، حيث إن خوارزميات ما بعد المعالجة ليست فقط معزولة عن تحسين النموذج، بل تكون أيضًا مكلفة من حيث الوقت، في حين يُعزز عادةً التحمل للقياسات المختلفة عن طريق دمج خرائط الميزات متعددة المقاييس بشكل مباشر. في هذه الورقة، نقترح وحدة تجزئة قابلة للتفاضل (DB) تدمج عملية التجزئة، وهي إحدى أهم الخطوات في عملية ما بعد المعالجة، داخل شبكة التجزئة. وبتحسين الشبكة التجزئية مع الوحدة المقترحة DB، يمكنها إنتاج نتائج أكثر دقة، مما يعزز دقة كشف النص من خلال مسار بسيط. علاوةً على ذلك، نقترح وحدة تكامل مقياس تكيفية فعالة (ASF) لتحسين مقاومة النموذج للقياسات المختلفة من خلال دمج الميزات المختلفة المقاييس بشكل تكيفي. وبدمج الوحدتين المقترحتين DB وASF مع شبكة التجزئة، يحقق كاشف النص المُقترح نتائج رائدة على مستوى العالم، من حيث دقة الكشف والسرعة، على خمسة معايير قياسية شهيرة.

الكشف عن النص في المشهد في الزمن الفعلي باستخدام التبديل القابل للتفاضل والدمج التكيفي للقياس | أحدث الأوراق البحثية | HyperAI