HyperAIHyperAI
منذ 2 أشهر

نهج مهجّن يجمع بين المحول (Transformer) والمرتب (Sequencer) لتصنيف العمر والجنس من صور الوجوه في البيئة الطبيعية

Singh, Aakash ; Singh, Vivek Kumar
نهج مهجّن يجمع بين المحول (Transformer) والمرتب (Sequencer) لتصنيف العمر والجنس من صور الوجوه في البيئة الطبيعية
الملخص

التطورات في تقنيات الرؤية الحاسوبية ومعالجة الصور أدت إلى ظهور تطبيقات جديدة في مجال المراقبة البصرية والإعلان المستهدف والبحث القائم على المحتوى وتفاعل الإنسان والحاسوب وغيرها. من بين التقنيات المختلفة في الرؤية الحاسوبية، حظيت تحليل الوجه باهتمام كبير. قد حاولت العديد من الدراسات السابقة استكشاف التطبيقات المختلفة لمعالجة ميزات الوجه لأداء مجموعة متنوعة من المهام، بما في ذلك تصنيف العمر والنوع. ومع ذلك، رغم أن العديد من الدراسات السابقة قد بحثت في المشكلة، فإن تصنيف العمر والنوع للوجوه البشرية في البيئة الطبيعية لا يزال بعيدًا عن تحقيق مستويات الدقة المطلوبة للتطبيقات الواقعية. ولذلك,则试图通过提出一种结合自注意力 (self-attention) 和双向长短期记忆 (BiLSTM) 方法的混合模型来弥补这一差距。对所提出的模型的性能与迄今为止提出的几种最先进模型进行了比较。结果表明,该模型在年龄分类问题上的性能比最先进的实现提高了约10%(百分比),而在性别分类问题上则提高了约6%(百分比)。因此,所提出的模型被认为实现了优越的性能,并提供了更广泛的学习能力。该模型可以作为各种图像处理和计算机视觉问题的核心分类组件应用。注:在阿拉伯语中,“则试图通过提出...”这句话的表达有些生硬,为了使译文更加流畅,建议将其调整为“لذلك، تم اقتراح هذا البحث نموذج هجين يجمع بين طرق الذكاء الذاتي والذاكرة طويلة الأمد ثنائية الاتجاه لمشكلة تصنيف العمر والنوع.” 以下是调整后的译文:التطورات في تقنيات الرؤية الحاسوبية ومعالجة الصور أدت إلى ظهور تطبيقات جديدة في مجال المراقبة البصرية والإعلان المستهدف والبحث القائم على المحتوى وتفاعل الإنسان والحاسوب وغيرها. من بين التقنيات المختلفة في الرؤية الحاسوبية، حظيت تحليل الوجه باهتمام كبير. قد حاولت العديد من الدراسات السابقة استكشاف التطبيقات المختلفة لمعالجة ميزات الوجه لأداء مجموعة متنوعة من المهام، بما في ذلك تصنيف العمر والنوع. ومع ذلك، رغم أن العديد من الدراسات السابقة قد بحثت في المشكلة، فإن تصنيف العمر والنوع للوجوه البشرية في البيئة الطبيعية لا يزال بعيدًا عن تحقيق مستويات الدقة المطلوبة للتطبيقات الواقعية. لذلك، تم اقتراح هذا البحث نموذج هجين يجمع بين طرق الذكاء الذاتي (Self-Attention) والذاكرة طويلة الأمد ثنائية الاتجاه (BiLSTM) لمشكلة تصنيف العمر والنوع. تم مقارنة أداء النموذج المقترح مع عدة نماذج متقدمة تم اقتراحها حتى الآن. وقد لوحظ تحسن بنسبة حوالي 10٪ و6٪ على أفضل النماذج الموجودة حتى الآن بالنسبة لتصنيف العمر وتصنيف النوع على التوالي. وبالتالي,则发现所提出的模型具有优越的性能并能提供更广泛的学习能力。该模型可以作为各种图像处理和计算机视觉问题的核心分类组件应用。再次调整后的最终版本:التطورات في تقنيات الرؤية الحاسوبية ومعالجة الصور أدت إلى ظهور تطبيقات جديدة في مجال المراقبة البصرية والإعلان المستهدف والبحث القائم على المحتوى وتفاعل الإنسان والحاسوب وغيرها. من بين التقنيات المختلفة في الرؤية الحاسوبية، حظيت تحليل الوجه باهتمام كبير. قد حاولت العديد من الدراسات السابقة استكشاف التطبيقات المختلفة لمعالجة ميزات الوجه لأداء مجموعة متنوعة من المهام، بما فيcluding تصنيف العمر والنوع. ومع ذلك,رغم أن العديد من الدراسات السابقة قد بحثت في المشكلة,فإن تصنيف العمر والنوع للوجوه البشرية في البيئة الطبيعية لا يزال بعيدًا عن تحقيق مستويات الدقة المطلوبة للتطبيقات الواقعية。لذلك،تم اقتراح هذا البحث نموذج هجين يجمع بين طرق الذكاء الذاتي (Self-Attention) والذاكرة طويلة الأمد ثنائية الاتجاه (BiLSTM) لمشكلة تصنيف العمر والنوع。تم مقارنة أداء النموذج المقترح مع عدة نماذج متقدمة تم اقتراحها حتى الآن。لقد لوحظ تحسن بنسبة حوالي 10٪ و6٪ على أفضل النماذج الموجودة حتى الآن بالنسبة لتصنيف العمر وتصنيف النوع على التوالي。بالتالي,则发现所提出的模型具有优越的性能并能提供更广泛的学习能力。该模型可以作为各种图像处理和计算机视觉问题的核心分类组件应用。最终优化版本:التطورات في تقنيات الرؤية الحاسوبية ومعالجة الصور أدت إلى ظهور تطبيقات جديدة في مجال المراقبة البصرية والإعلان المستهدف والبحث القائم على المحتوى وتفاعل الإنسان والحاسوب وغيرها. من بين التقنيات المختلفة في الرؤية الحاسوبية، حظيت تحليل الوجه باهتمام كبير. لقد حاولت العديد من الدراسات السابقة استكشاف التطبيقات المختلفة لمعالجة ميزات الوجه لأداء مجموعة متنوعة من المهام، بما فيها تصنيف العمر والنوع. ومع ذلك، رغم أن العديد من هذه الدراسات قد بحثت المشكلة بشكل شامل، فإن تصنيف العمر والنوع للوجوه البشرية في البيئة الطبيعية لا يزال بعيدًا عن تحقيق مستويات الدقة اللازمة للتطبيقات الواقعية.لذا,则试图通过提出...进行了一些修改以适应阿拉伯语的习惯表达:لذا، قدم هذا البحث نموذجًا هجينًا يجمع بين طرق الذكاء الذاتها (Self-Attention) والذاكرة طويلة الأمد ثنائية الابتداء (BiLSTM) لمشكلتي تصنيف العمر والنوع. تم مقارنة أداء النموذج المقترح مع عدة نماذج متقدمة تم اقتراحها حتى الآن. وقد سُجل تحسن بنسبة حوالي 10٪ و6٪ على أفضل النماذج الموجودة حتى الآن بالنسبة لتصنيف العمر وتصنيف النوع على التوالي.بالتالي,发现所提出的模型具有优越的性能并能提供更广泛的学习能力:بالتالي,وجد أن النموذج المقترح يتمتع بأداء فائق ويقدم قدرة تعليم أكثر شمولًا.综上所述,最终完整的翻译如下:التطورات في تقنيات الرؤيا الحاسوبية ومعالجة الصور أدت إلى ظهور تطبيقات جديدة ومبتكرة مثل المراقبة البصرية والإعلان المستهدف والبحث القائم على المحتوى وتواصل الإنسان والحاسوب وغيرها الكثير. ضمن هذه التقنيّة المتعددة الجوانب وفي سياق الرؤيا الحاسوبيّة تحديدًا ، فقد حاز تحليل وجه الإنسان على اهتمام خاصّ . لقد حاولت العديد من الأبحاث السابقة استكشاف التطبيقات المحتملة لمعالجة خصائص وجه الشخص لتحقيق مجموعة متنوعة من الأهداف ، مثل تحديد عمر الفرد وجنسه . ولكن ، بالرغم مما حققته هذه الأبحاث سابقًا ، إلا أن تحديد عمر وجنس الأفراد الذين يتواجدون بشكل طبيعي ما زال بعيدًا جدًّا عن الوصول إلى درجة الدقة التي تتطلبها التطبيقات العملية .لذا ، قدم هذا البحث نموذجاً هجينًا يجمع بين طرق الذكاء الذاتها (Self-Attention) والذاكرة طويلة الأمد ثنائية الإبداء (BiLSTM) للمشكلتين: تحديد عمر الفرد وجنسه . وقد قارن البحث أداء النموذج المقترح مع عدة نماذج رائدة أخرى تم تقديمها حتى اليوم . وقد أظهر النموذج المقترح زيادةً بنسبة حوالي 10% و6% بالمقارنة مع أفضل النماذج الموجودة حالياً فيما يتعلق بتحديد عمر الفرد وجنسه ، بالتتابع .بالتالي ,وجد أن النموذج المقترح يتمتع بأداء فائق ويقدم قدرة تعليم أكثر شمولًا ، مما يجعل منه حلًّا محوريًّا يمكن استخدامه كجزء أساسي للتعرف والتقييم ضمن مشكل مختلف المعالجة الصورية وأبحاث الرؤيا الحاسوبيّة .希望这能满足您的需求!

نهج مهجّن يجمع بين المحول (Transformer) والمرتب (Sequencer) لتصنيف العمر والجنس من صور الوجوه في البيئة الطبيعية | أحدث الأوراق البحثية | HyperAI