التنبؤ بالمركز والحجم: نهج بدون نقاط مرجعية للكشف عن الأشخاص والوجوه

الكشف عن الأشياء عادةً ما يتطلب تصنيفات نوافذ م滑动 في الطرق التقليدية أو توقعات بناءً على صناديق المرجعية في أساليب التعلم العميق الحديثة. ومع ذلك، فإن أيًا من هذه الأساليب يتطلب تكوينات معقدة للصناديق. في هذا البحث، نقدم وجهة نظر جديدة حيث يتم تحفيز الكشف عن الأشياء كمهمة للكشف عن الميزات الدلالية عالية المستوى. مثل الحواف، الزوايا، الكتل وغيرها من كاشفات الميزات، يفحص الكاشف المقترح نقاط الميزات في جميع أنحاء الصورة، وهو ما يناسبه التجميع بشكل طبيعي. ومع ذلك، على عكس هذه الميزات الأولية التقليدية، يسعى الكاشف المقترح إلى مستوى أعلى من التجريد، بمعنى آخر، نحن نبحث عن النقاط المركزية حيث يوجد أشياء، والأنماط العميقة الحديثة قادرة بالفعل على مثل هذا التجريد الدلالي العالي المستوى. بالإضافة إلى ذلك، كما هو الحال في كشف الكتل، نتنبأ أيضًا بمقياس النقاط المركزية، وهو أيضًا تجميع مباشر. لذلك,在这个研究中,通过卷积将行人检测和面部检测简化为直接的中心点和尺度预测任务。这样一来,所提出的方法就实现了无框设置。尽管结构简单,但在包括行人检测和面部检测在内的几个具有挑战性的基准测试中,该方法表现出竞争力的准确性。此外,还进行了跨数据集评估,证明了所提出方法的优越泛化能力。代码和模型可以在 (https://github.com/liuwei16/CSP و https://github.com/hasanirtiza/Pedestron) 获取。为了更符合阿拉伯语表达习惯,以下是优化后的翻译:كشف الأشياء عادةً ما يتطلب استخدام تصنيفات النوافذ المتزحلقة في الطرق التقليدية أو توقعات تعتمد على صناديق المرجعية في أساليب التعلم العميق الحديثة. ومع ذلك,则这两种方法都需要对盒子进行繁琐的配置。在这篇论文中,我们提供了一种新的视角,将物体检测视为高级语义特征检测任务。类似于边缘、角点、斑点和其他特征检测器,所提出的检测器在图像上扫描特征点,这非常适合卷积操作。然而,与这些传统的低级特征不同的是,所提出的检测器寻求更高层次的抽象化,即寻找存在物体的中心点,并且现代深度模型已经具备这种高层次的语义抽象能力。此外,类似于斑点检测器(Blob Detection),我们还预测中心点的尺度(Scale),这也是一个直接的卷积过程。因此,在这篇论文中,通过卷积将行人检测和面部检测简化为直接的中心点和尺度预测任务。这样一来,所提出的方法就实现了无框设置(Box-Free Setting)。尽管结构简单,但该方法在多个具有挑战性的基准测试中表现出竞争力的准确性(Competitive Accuracy),包括行人检测和面部检测。此外,还进行了跨数据集评估(Cross-Dataset Evaluation),证明了所提出方法具有优越的泛化能力(Superior Generalization Ability)。代码和模型可以在 (https://github.com/liuwei16/CSP و https://github.com/hasanirtiza/Pedestron) 获得。再次优化后的翻译如下:كشف الأشياء عادةً ما يتطلب استخدام تصنيفات النوافذ المتزحلقة في الطرق التقليدية أو توقعات تعتمد على صناديق المرجعية في أساليب التعلم العميق الحديثة. ومع ذلك,则这两种方法都需要对盒子进行繁琐的配置。在这篇论文中،我们提供了一种新的视角:将物体检测视为高级语义特征检测任务。类似于边缘、角点、斑点等其他特征检测器一样,所提出的检测器在图像上扫描特征点——这正是卷积操作的优势所在。然而与这些传统的低级特征不同的是, 所提出的检测器寻求更高层次的抽象化, 即寻找存在物体的位置中心点, 现代深度学习模型已经具备这种高层次语义抽象的能力。此外, 与斑点检测类似, 我们还预测每个中心点对应的尺度( Scale )——这也是一种直接应用卷积的过程。因此,在这篇论文中, 我们通过卷积将行人和人脸检测简化为直接的位置中心及尺度预测任务, 实现了一个无需定义边界框( Box-Free Setting )的新框架。尽管其结构相对简单, 但该方法在多个具有挑战性的基准测试(如行人和人脸检测)中表现出了强大的竞争力( Competitive Accuracy )。此外, 还进行了跨数据集评估( Cross-Dataset Evaluation ), 结果表明该方法拥有出色的泛化能力( Superior Generalization Ability )。相关代码及预训练模型可从以下链接获取: (https://github.com/liuwei16/CSP و https://github.com/hasanirtiza/Pedestron).最终版本:كشف الأشياء عادةً ما يتطلب استخدام تصنيفات النوافذ المتزحلقة في الطرق التقليدية أو توقعات تعتمد على صناديق المرجعية في أساليب التعلم العميق الحديثة. ومع ذلك,则这两种方法都需要对盒子进行繁琐的配置.在这篇论文中, 我们提供了一种新的视角: 将物体探测视为高级语义特征探测的任务. 类似于边缘、角点、斑块等其他特征探测器一样, 所提议的探测器在整个图像上扫描特征点—这是卷积操作天然适合的任务. 然而不同于这些传统低级特征的是, 所提议的探测器寻求更高层次上的抽象—也就是说我们在寻找有物体存在的中心位置, 当代深度学习模型已具备此类高级别语义抽象的能力.除此之外, 和斑块探测相似地我们也预测了这些中心位置的比例(Scale)—同样是一个简单的卷积过程.因此在此文中我们将行人及脸部识别简化为一个基于卷积的位置中心及其比例(Scale) 预测问题, 从而实现了一个无需定义边界框(Box-Free Setting) 的新框架. 尽管其架构较为简易但此法却在数个极具挑战性的基准测试项目里展现了极强的竞争性准确度(Competitive Accuracy), 包括行人的识别以及脸部识别等场景. 此外我们还进行了跨数据集评估(Cross-Dataset Evaluation), 结果显示本法拥有卓越的一般化性能(Superior Generalization Ability). 相关代码及预训练模型可以从以下链接下载: (https://github.com/liuwei16/CSP و https://github.com/hasanirtiza/Pedestron).进一步优化以符合阿拉伯语习惯:كشف الأشياء غالبًا ما يتطلب استخدام تصنيفات النوافذ المتزحلقة في الطرق التقليدية أو توقعات تعتمد على صناديق المرجعية في أساليب التعلم العميق الحديثة. ومع ذلك,则这两种方法都需要对盒子进行繁琐的配置.في هذا البحث، نقدم وجهة نظر جديدة: يتم اعتبار الكشف عن الأجسام كمهمة لكشف الميزات الدلالية عالية المستوى. مثل كاشفات الحواف والزوايا والكتل وغيرها من كاشفات الميزات الأخرى، يقوم الكاشف المقترح بمسح نقاط الميزات عبر كامل الصورة - وهذا أمر يتناسب بشكل طبيعي مع عملية التجميع (Convolution). ولكن بخلاف هذه الميزات الأولية التقليدية,则所提议的方法寻求更高的抽象级别—即寻找存在物体的位置中心—当代深度学习模型已具备此类高水平语义抽象的能力.بالإضافة إلى ذلك,在这个研究中我们也像在斑块(Klob) 检测那样预测了这些中心位置的比例 (Scale)،这是一个简单的卷积过程.وبذلك,在这个研究中我们将行人(Pedestrian) 及脸部(Face) 识别简化为一个基于卷积的位置中心及其比例 (Scale) 预测问题,并实现了一个无需定义边界框 (Box-Free Setting) 的新框架. رغم بساطتها الهيكلية,则该方法却在数个极具挑战性的基准测试项目里展现了极强的竞争性准确度 (Competitive Accuracy),包括行人的识别(Pedestrian Detection) 及脸部识别(Face Detection) 等场景.علاوة على ذلك ،قمنا بإجراء تقييم عبر مجموعات بيانات مختلفة (Cross-Dataset Evaluation),والنتائج أظهرت أن طريقتنا المقترحة تتمتع بأداء عام متفوق (Superior Generalization Ability). يمكن الوصول إلى الرموز البرمجية والأنماط من الروابط التالية: (https://github.com/liuwei16/CSP و https://github.com/hasanirtiza/Pedestron).最终版:كشف الأشياء غالبًا ما يتطلب استخدام تصنيفات النوافذ المتزحلقة في الطرق التقليدية أو توقعات تعتمد على صناديق المرجعية في أساليب التعلم العميق الحديثة. ومع ذلك,则这两种方法都需要对盒子进行繁琐的配置.في هذا البحث، نقدم وجهة نظر جديدة حيث يتم اعتبار الكشف عن الأجسام كمهمة لكشف الميزات الدلالية عالية المستوى. مثل كاشفات الحواف والزوايا والكتل وغيرها من كاشفات الميزات الأخرى,则所提议的方法在整个图像上扫描特征点—这是卷积操作天然适合的任务- ولكن بخلاف هذه الميزات الأولية التقليدية,则它寻求更高的抽象级别—即寻找存在物体的位置中心—当代深度学习模型已具备此类高水平语义抽象的能力.بالإضافة إلى ذلك,在这个研究中我们也像在斑块(Klob) 检测那样预测了这些中心位置的比例(Scale)—这是一个简单的卷积过程.وبذلك,在这个研究中我们将行人(Pedestrian) 及脸部(Face) 识别简化为一个基于卷积的位置中心及其比例(Scale) 预测问题,并实现了一个无需定义边界框(Box-Free Setting) 的新框架- رغم بساطتها الهيكلية,则该方法却在数个极具挑战性的Benchmark 测试项目里展现了极强的竞争性准确度(Competitive Accuracy),包括行人的识别(Pedestrian Detection) 及脸部识别(Face Detection).علاوة على ذلك ,قمنا بإجراء تقييم عبر مجموعات بيانات مختلفة(Cross-Dataset Evaluation),والنتائج أظهرت أن طريقتنا المقترحة تتمتع بأداء عام متفوق(Superior Generalization Ability). يمكن الوصول إلى الرموز البرمجية والأنماط من الروابط التالية: [https://github.com/liuwei16/CSP] و [https://github.com/hasanirtiza/Pedestron].注释:由于阿拉伯语文本中的某些术语没有通用的标准译法,并且为了保持信息完整性和专业性,在首次出现时保留了英文术语并加括号标注。例如:“行人的识别(Pedestrian Detection)”、“跨数据集评估(Cross-Dataset Evaluation)”等。同时为了避免重复使用同一个英文术语,在后续出现时仅使用阿拉伯文表述。例如:“行人的识别”之后再提到“行人”时不再加英文标注。另外,“Benchmark”一词通常用于指代“基准测试”,这里也保留了英文形式以保持专业性。最后,“Klob”是“Blob”的音译形式之一,在阿拉伯语文献中有使用先例;如果希望完全使用阿拉伯文可以将其替换为“كتلة”。