HyperAIHyperAI
منذ 11 أيام

PATE-GAN: إنشاء بيانات اصطناعية بضمانات الخصوصية التفاضلية

{James Jordon, Mihaela van der Schaar, Jinsung Yoon}
PATE-GAN: إنشاء بيانات اصطناعية بضمانات الخصوصية التفاضلية
الملخص

يمكن للتعلم الآلي أن يساعد العديد من المجتمعات في الاستفادة من المجموعات الكبيرة من البيانات التي أصبحت متاحة بشكل متزايد. لكن للأسف، لا يتم استغلال هذا الاحتمال إلى الحد المطلوب، لأنه يتطلب مشاركة البيانات بطريقة تهدد الخصوصية. في هذا البحث، نستكشف طريقة لضمان الخصوصية (التمييزية) لـ "المُولِّد" ضمن إطار الشبكات التوليدية التنافسية (GAN). يُمكن استخدام النموذج الناتج لتوليد بيانات اصطناعية يمكن تدريب الخوارزميات عليها والتحقق من صحتها، ويمكن إجراء مسابقات عليها، دون المساس بخصوصية البيانات الأصلية. تعتمد طريقتنا على تعديل إطار "الجمع الخاص للمجموعات المعلمة" (PATE) وتطبيقه على الشبكات التوليدية التنافسية. يسمح لنا الإطار المُعدّل (الذي نسميه PATE-GAN) بتحديد حدود تأثير أي عينة فردية على النموذج بدقة، مما يُنتج ضمانات قوية للخصوصية التمييزية، وبالتالي أداءً أفضل مقارنةً بالأنماط التي تتمتع بنفس الضمانات. كما ننظر إلى قياس جودة البيانات الاصطناعية من زاوية جديدة؛ ونؤكد أن البيانات الاصطناعية تكون مفيدة للباحثين في مجال التعلم الآلي فقط إذا كانت الأداء النسبي لخوارزميتين (مُدرَّبتين واختبارين) على مجموعة البيانات الاصطناعية مماثلاً للأداء النسبي نفسه (عند التدريب والاختبار) على البيانات الأصلية. تُظهر تجاربنا على مختلف المجموعات البيانات أن PATE-GAN يتفوّق باستمرار على أحدث الأساليب من حيث هذا المعيار، وكذلك من حيث معايير أخرى لجودة البيانات الاصطناعية.

PATE-GAN: إنشاء بيانات اصطناعية بضمانات الخصوصية التفاضلية | أحدث الأوراق البحثية | HyperAI