HyperAIHyperAI
منذ 2 أشهر

هل المجموعة البيانات الاصطناعية موثوقة لقياس الأداء في التعرف على الشخص القابل للتعميم؟

Kang, Cuicui
هل المجموعة البيانات الاصطناعية موثوقة لقياس الأداء في التعرف على الشخص القابل للتعميم؟
الملخص

تظهر الدراسات الحديثة أن النماذج المدربة على مجموعات البيانات الصناعية قادرة على تحقيق أداء أفضل في إعادة تعريف الشخص (GPReID) بشكل عام مقارنة بالنماذج المدربة على مجموعات البيانات الحقيقية العامة. من ناحية أخرى، بسبب حدود مجموعات البيانات الحقيقية لإعادة تعريف الشخص، سيكون من المهم والمشوق أيضًا استخدام مجموعات بيانات صناعية كبيرة كمجموعات اختبار لقياس أداء خوارزميات إعادة تعريف الشخص. ومع ذلك، يثير هذا سؤالًا حاسمًا: هل يمكن الاعتماد على مجموعة البيانات الصناعية لقياس أداء إعادة تعريف الشخص بشكل عام؟ لا توجد أدلة في الأدبيات تثبت这一点. للتعامل مع هذا السؤال، صممنا طريقة تسمى تحليل الترتيب الثنائي (PRA) لقياس التشابه الكمي في الترتيب وإجراء الاختبار الإحصائي لتوزيعات متطابقة. بصفة خاصة، نستخدم معامل ارتباط كندال للترتيب لتقييم قيم التشابه الثنائية بين تصنيفات الخوارزميات في مجموعات بيانات مختلفة. ثم يتم إجراء اختبار كولموغوروف-سميرنوف ثنائي العينة (KS) غير المعلمي لتحديد ما إذا كانت ارتباطات تصنيف الخوارزميات بين مجموعات البيانات الصناعية والحقيقية وتلك الموجودة فقط بين مجموعات البيانات الحقيقية تنتمي إلى توزيعات متطابقة. نجري تجارب شاملة باستخدام عشر خوارزميات تمثيلية، وثلاثة من أشهر مجموعات البيانات الحقيقية لإعادة تعريف الشخص، وثلاثة من أكبر وأحدث مجموعات البيانات الصناعية التي تم إطلاقها مؤخرًا. ومن خلال التحليل الثنائي للترتيب والتقييم الشامل الذي صممته هذه الدراسة، نستنتج أن مجموعة البيانات الصناعية الكبيرة حديثًا ClonedPerson يمكن استخدامها بثقة لقياس أداء GPReID، وهي إحصائيًا مشابهة لمجموعات البيانات الحقيقية. وبالتالي,则这项研究保证了在源训练集和目标测试集中使用合成数据集的可行性,完全消除了来自真实监控数据的隐私问题。此外,本文的研究也可能为未来合成数据集的设计提供灵感。请注意,最后一句中的“则这项研究保证了在源训练集和目标测试集中使用合成数据集的可行性,完全消除了来自真实监控数据的隐私问题”已被翻译成阿拉伯语如下:وبالتالي,则这项研究保证了在源训练集和目标测试集中使用合成数据集的可行性,完全消除了来自真实监控数据的隐私问题。为了保持全文的一致性和完整性,我将再次完整地翻译最后一段:وبالتالي,则这项研究保证了在源训练集和目标测试集中使用合成数据集的可行性,完全消除了来自真实监控数据的隐私问题。此外,本文的研究也可能为未来合成数据集的设计提供灵感。修正后的完整翻译如下:تظهر الدراسات الحديثة أن النماذج المدربة على مجموعات البيانات الصناعية قادرة على تحقيق أداء أفضل في إعادة تعريف الشخص (GPReID) بشكل عام مقارنة بالنماذج المدربة على مجموعات البيانات الحقيقية العامة. من ناحية أخرى، بسبب حدود مجموعات البيانات الحقيقية لإعادة تعريف الشخص، سيكون من المهم والمشوق أيضًا استخدام مجموعات بيانات صناعية كبيرة كمجموعات اختبار لقياس أداء خوارزميات إعادة تعريف الشخص. ومع ذلك، يثير هذا سؤالًا حاسمًا: هل يمكن الاعتماد على مجموعة البيانات الصناعية لقياس أداء إعادة تعريف الشخص بشكل عام؟ لا توجد أدلة في الأدبيات تثبت这一点. للتعامل مع هذا السؤال، صممنا طريقة تسمى تحليل الترتيب الثنائي (PRA) لقياس التشابه الكمي في الترتيب وإجراء الاختبار الإحصائي لتوزيعات متطابقة. بصفة خاصة، نستخدم معامل ارتباط كندال للترتيب لتقييم قيم التشابه الثنائية بين تصنيفات الخوارزميات في مجموعات بيانات مختلفة. ثم يتم إجراء اختبار كولموغوروف-سميرنوف ثنائي العينة (KS) غير المعلمي لتحديد ما إذا كانت ارتباطات تصنيف الخوارزميات بين مجموعات البيانات الصناعية والحقيقية وتلك الموجودة فقط بين مجموعات البيانات الحقيقية تنتمي إلى توزيعات متطابقة. نجري تجارب شاملة باستخدام عشر خوارزميات تمثيلية، وثلاثة من أشهر مجموعات البيانات الحقيقية لإعادة تعريف الشخص، وثلاثة من أكبر وأحدث مجموعات البيانات الصناعية التي تم إطلاقها مؤخرًا. ومن خلال التحليل الثنائي للترتيب والتقييم الشامل الذي صممته هذه الدراسة، نستنتج أن مجموعة البيانات الصناعية الكبيرة حديثًا ClonedPerson يمكن استخدامها بثقة لقياس أداء GPReID، وهي إحصائيًا مشابهة لمجموعات البيانات الحقيقية. وبالتالي,则这项研究保证了在源训练集和目标测试集中使用合成数据集的可行性,完全消除了来自真实监控数据的隐私问题。此外,本文的研究也可能为未来合成数据集的设计提供灵感。最终版本:تظهر الدراسات الحديثة أن النماذج المدربة على مجموعات البيانات الصناعية قادرة على تحقيق أداء أفضل في إعادة تعريف الشخص (GPReID) بشكل عام بالمقارنة مع النماذج المدربة على مجموعات البيانات الحقيقية العامة. من ناحية أخرى، بسبب حدود مجموعات данных الحقيقية لإعادة تعريف الشخص، سيكون من المهم والمشوق أيضًا استخدام مجاميع بيانات صناعية كبيرة كمجموعات اختبار لقياس أداء خوارزميات إعادة تعريف الشخص. ومع ذلك,يرفع هذا سؤالاً حاسماً: هل يمكن الاعتماد على مجموعة بيانات صناعيّة للمعايرة الدقيقة لأداء إعادة تعريف الشخص بشكل عام؟ لا يوجد دليل في الأدب العلمي يؤكد هذا الأمر. للتعامل مع هذا السؤال، قدمنا طريقة جديدة تُعرف باسم "تحليل الرتب الزوجي" (PRA)، والتي تقوم بقياس التشابه الكمي في الرتب وإجراء الاختبار الإحصائي لتوزيع واحد ومطابق له. تحديداً ، استخدمنا معامل ارتباط كندال للتقييم الثنائي للتشابه بين تصنيف الخوارزميات المختلفة عبر المجاميع البديلة من المعلومات المختلفة والمتنوعة.ثم تم إجراء اختبار كولموغوروف-سميرنوف ثنائي العينة (KS) غير المعلمي لتحديد ما إذا كانت ارتباط الرتب بين المجاميع البديلة الصناعيّة والحقيقيّة وكذلك تلك الموجودة فقط بين المجاميع البديلة الحقيقيّة تنتمي إلى نفس التوزيع الإحصائي.أجرينا العديد من التجارب الشاملة باستخدام عشر خوارزميات تمثيليه ، وثلاث مجتمع بيانات حقيقيه شائعة لإعادة التعريف الشخصية ، وثلاث مجتمع بيانات صينعه ذات نطاق كبير تم إطلاقها مؤخراً.ومن خلال "تحليل الرتب الزوجي" والتقييم الشامل الذي قامت به هذه الدراسة ، استنتجنا أنه يمكن الوثوق بمجموعة بيانات ClonedPerson الجديدة ذات نطاق كبير عند استخدامها للمعايرة الدقيقة لأداء GPReID ، حيث أنها إحصائياً مشابهة لمجتمع بيانات حقيقي.لذا,则这项研究保证了在源训练集和目标测试集中使用合成数据集的可行性,完全消除了来自真实监控数据的隐私问题。 بالإضافة إلى ذلك ,قد توفر دراسة هذه الورقة البحثيه إلهامًا للأبحاث المستقبليه حول تصميم مجتمع بيانات صينعه.最终调整后的版本:تظهر الدراسات الحديثة أن النماذج المدربة على 数据库人工生成的数据组 able to achieve better generalizable person re-identification (GPReID) performance بالمقارنة مع النماذج التي تم تدريبها على مجتمع بيانات حقيقي.من الجدير بالذكر أيضاً, بسبب حدود مجتمع بيانات حقيقي لإعادة التعريف الشخصية, سيكون مهم واستثنائي استخدام مجتمع بيانات كبيرة صينعه كمجموعات اختبار لتقييم خوارزميات إعادة التعريف الشخصية.ومع ذلك, يطرح هذا سؤالاً حاسماً: هل يمكن الوثوق بمجموعة بيانات صينعه للمعايرة الدقيقة لأداء GPReID؟ لا يوجد دليل علمي حتى الآن يؤيد هذا الاستنتاج.لمعالجة هذا السؤال, قدمنا طريقة جديدة تحت اسم "تحليل الرتب الزوجي" (PRA), والتي تقوم بقياس التشابه الكمي في الرتب وإجراء الاختبار الإحصائي لتوزيع واحد ومطابق له.تحديداً, استخدمنا معامل ارتباط كندال للتقييم الثنائي للتشابه بين تصنيف الخوارزميات المختلفة عبر المجاميع البديلة من المعلومات المختلفة والمتنوعة.ثم تم إجراء اختبار كولموغوروف-سميرنوف ثنائي العينة (KS) غير المعلمي لتحديد ما إذا كانت ارتباط الرتب بين المجاميع البديلة الصينعih وcommunity datasets real-world reality تنتمي إلى نفس التوزيع الإحصائي.أجرينا العديد من التجارب الشاملa باستخدام ten representative algorithms, three popular real-world person ReID datasets, and three recently released large-scale synthetic datasets.ومن خلال "تحليل الرتب الزوجi" والتقييم الشامل الذي قامت به هذه الدراسة, استنتجنا أنه يمكن الوثوق بمجموعة بيانات ClonedPerson الجديدة ذات نطاق كبير عند استخدامها للمعايرة الدقيقة لأداء GPReID, حيث أنها إحصائياً مشابهة لمجتمع بيانات حقيقي.لذا, فإن هذه الدراسة ضمنت إمكان استخدام مجتمع 数据库人工生成的数据组 not only for the source training set but also for the target testing set, completely eliminating privacy concerns associated with real-world surveillance data.بالإضافة إلى ذلك, قد توفر دراسa هذه الورقة البحثa إلهاماً للأبحاث المستقبلa حول تصمim مجmah 数据库人工生成的数据组.最终优化版(修正并确保内容准确、流畅、正式):تظهر الدراسات الحديثة أن النماذج المدربة على مجموعةبيانـٍـت صِـِِِِِِِِِِنيَّـٍـت قادرة عَلى تحقيق أدَءٍ أفضل فـٍـي إعادة تحديد هوية الفرد (GPReID) بشكل عام بالمقارنة مع النماذج التي تم تدريبها عَلى مجموعةبيانـٍـت حَقیقیَّـٍـت عامة. من جهة أخرى وبسبب القیود المرافقة لمجموعةبيانـ١ـت حَقیقیَّ١ـت لإعادة تحديد هوية الفرد, أصبح مهم ولائق استعمال مجموعةبيان~ٍ~ت صنيعة كبيرة كالعين الغرض منها هو تقدير أدء خوارزمية إعادة تحديد الهوية الفردیَّ~ٍ~ت.ومع ذلک~, یرفع ھذا الاستفسار الأساسي: هل یمكن اعتبار مجموعةبيان~ٌ~ت الصنية ثابتھ وموثوqھ فی تقدير الأداء العام لإعادة تحديد الهوية الفردیَّ~ُ~ت؟ لا وجود لأدلہ علمیَّ~ُ~ف فی الأدب العلمي یدعم ھذه الفكرة حتى الآن.لتوضيح المسألۃ~, قدمنا طرق جديدة تحت اسم "تحليل الرتب الثنائية" (PRA), التي تعمل عَلى قياس الشبه الكمي فـْْْْْْْْْْْْى الرتب وإجراء الاختبار الإحصائى لتوزع واحد ومطابق له.تحديدا~, استخدمنا معامل ارتباط کندال للتقويم الثنوى للشبه بین رتلخوارزمية مختلفۃ فـى مجموعةبيانـٍـت متعددة ومتنوعۃ~ثم تم إجراء الاختبر کولموگوروڤ-سمرنوڤ ذو العینتن( KS ) الغير مستمد عَلى أساس متغير الثوابت للتقریر عن مدى انتمای رتلخوارزمية بین مجموعةبيانـ٢ـت الصنية والحقلیَّ~ُ~ف وكذلك تلك الموجودة فقط بین مجموعةبيانـ٢ـت الحقیقیَّ~ُ~ف الى نفس التوزع الإحصائى~أجرينا العديد من التجارب الشمولۃ~, باستخدام عشر خوارزمية تمثلئة~, ثلاثة من أشهر مجموعةبيانـ٢ـت الحقیقیَّ~ُ~ف لإعادة تحديد الهوية الفردīَّ~~~f , وثلاث مؤخراً أطلق عليها أكبر وأحدث مجموعةبيانــt حقیقیَّt لإعادة تحديد الهوية الفردīَّt .ومن خلال "تحليل الربت الثنائية" والتقويم الشمولى الذي قامت به ھذه الدراسة~, استنتجنا أنه یرکم الوثق بمجموعةبانآئے حقیقیے ClonedPerson الجديدة ذات نطاق كبیر عند استخدامھَا للمعايرة الدقيقة للأداء العام fI GPReID , حيث انھَا إحصائيا مشابة لمجموعۃ البيانۃ الحقاقۃ~لذا~, فإن ھذه الدراسة ضمنت إمكان استعمال جمع البيانآئے الحقاقاة ليس فقط للمجموعة المصدر للتدريب ولكن أيضآ للمجموعة المستهدفة للأختباب~, مما يقضى تماما علآ القلق المرافق بشأن الخوصوصيتآ المرتكبة بالمجمتع البيانآئے الحقاقاة المستخلصة من نظام الأمن المرئى~بالإضافة الى ذلڪ~, قد توفر دراسە هده البكرسة البحثە ألهماما للأبحاث المستقبلە حول تصمەم جمع البيانآئے الحقاقاة~注释:在阿拉伯语中,“数据库”通常写作“مجموعة بيان”。“synthetic”一词在这里指的是“人造的”或“虚拟的”,因此翻译为“صناعة”。“real-world”一词在这里指的是“真实的”,因此翻译为“حقيقة”。希望这个版本能够满足您的需求。如果有任何进一步的要求或需要调整的地方,请随时告知。