2ヶ月前
zGAN: 実際の合成データ生成に焦点を当てた外れ値指向のジェネレーティブ・アドバーザリアル・ネットワーク
Azizjon Azimi; Bonu Boboeva; Ilyas Varshavskiy; Shuhrat Khalilbekov; Akhlitdin Nizamitdinov; Najima Noyoftova; Sergey Shulgin

要約
「ブラックスワン」現象は、古典的な機械学習モデルの性能に根本的な挑戦をもたらしています。特にパンデミック後の環境において、外れ値条件の頻度が増加していると認識されており、これによりモデル訓練における実際のデータに対する合成データの補完的な利用の探求が求められています。本記事では、外れ値特性を持つ合成テーブルデータを生成するために開発されたzGANモデルアーキテクチャについて、一般的な概要と実験的調査を提供します。このモデルは二値分類環境でテストされ、現実的な合成データ生成において有望な結果を示しており、モデル性能向上能力も確認されています。zGANの特徴的な点は、生成されたデータ内の特徴量間での相関関係を強化することです。これは実際の訓練データ内の特徴量間の相関関係を再現します。さらに重要なのは、zGANが実際のデータまたは合成的に生成された共分散に基づいて外れ値を生成する能力です。この外れ値生成手法は複雑な経済イベントのモデリングや、予測モデルの訓練や外れ値検出・処理・除去などのタスクにおける外れ値の拡張に活用できます。本研究の一環として、プライベート(金融サービスにおける信用リスク)およびパブリックデータセットを使用して実験と比較分析が行われました。