2 个月前

zGAN:一种专注于异常值的生成对抗网络用于生成逼真的合成数据

Azizjon Azimi; Bonu Boboeva; Ilyas Varshavskiy; Shuhrat Khalilbekov; Akhlitdin Nizamitdinov; Najima Noyoftova; Sergey Shulgin
zGAN:一种专注于异常值的生成对抗网络用于生成逼真的合成数据
摘要

“黑天鹅”现象对经典机器学习模型的性能构成了根本性的挑战。异常条件出现频率的增加,尤其是在疫情后的环境中,促使研究人员探索合成数据作为真实数据在模型训练中的补充。本文对为生成具有异常特征的合成表格数据而开发的zGAN模型架构进行了总体概述和实验研究。该模型在二分类环境中接受了测试,并在生成逼真的合成数据以及提升模型性能方面显示出令人鼓舞的结果。zGAN的一个显著特点是其在生成的数据中增强了特征之间的相关性,复制了真实训练数据中特征的相关性。此外,至关重要的是,zGAN能够基于真实数据的协方差或合成生成的协方差来生成异常值。这种异常值生成方法使得复杂经济事件的建模成为可能,并且可以增强预测模型的训练、检测、处理或移除异常值等任务中的异常值数量。本研究中的实验和比较分析是在私有(金融服务领域的信用风险)和公共数据集上进行的。