11 天前

CorGAN:用于生成合成医疗记录的相关性捕捉卷积生成对抗网络

Amirsina Torfi, Edward A. Fox
CorGAN:用于生成合成医疗记录的相关性捕捉卷积生成对抗网络
摘要

深度学习模型在图像分类、语音处理等领域已展现出卓越的性能。然而,利用电子健康记录(Electronic Health Record, EHR)数据构建深度学习模型时,研究者面临独特的隐私挑战。这一问题促使人们将关注点聚焦于在保障隐私的前提下生成具有真实性的合成数据。本文提出一种名为“相关性捕捉生成对抗网络”(Correlation-Capturing Generative Adversarial Network, CorGAN)的新型框架,用于生成合成医疗记录。在CorGAN中,我们结合卷积生成对抗网络(Convolutional GAN)与卷积自编码器(Convolutional Autoencoder),利用卷积神经网络(Convolutional Neural Networks)在数据表示空间中捕捉相邻医疗特征之间的相关性。为验证模型的真实性,我们展示了CorGAN生成的合成数据在多种机器学习任务(如分类与预测)中表现出与真实数据相当的性能。此外,本文还进行了隐私性评估,并对合成数据的真实特性进行了统计分析。本研究的软件已开源,可访问:https://github.com/astorfi/cor-gan。

CorGAN:用于生成合成医疗记录的相关性捕捉卷积生成对抗网络 | 最新论文 | HyperAI超神经