17日前

増強を用いたモデル性能の向上とクラス不均衡問題の除去

{Dr. Venkateswara Rao Gurrala, Allena Venkata Sai Abhishek}
要約

現実世界のデータは、多様な困難な特徴を含んでおり、その中でも特に顕著なのは、データセット内の異なるクラス間でサンプル数に偏り(クラス不均衡)が生じる現象である。このクラス不均衡は、データに対してさまざまなサンプリング技術を適用することで解決が試みられている。特に、データ増強(Augmentation)技術は、機械学習パイプラインにおける重要なステップの一つであり、少数クラスのデータを過剰にサンプリング(オーバーサンプリング)するために用いられる。本研究では、さまざまなデータ増強手法を用いてバランスの取れた増強データセットを生成し、クラス不均衡問題を解消することで、モデル性能の向上を目指す。具体的には、異なるデータ増強技術とランダムサンプリングを組み合わせ、複数のバランス化された増強データセットを構築する。各増強手法に対して、RESNET18モデルを用いて精度を評価し、各ケースについて最大100エポックまで学習を実行した上で、得られた最高精度を比較検討した。この繰り返しによるさまざまな増強手法の比較を通じて、複数のデータセットにおける手法の有効性に関する有意義な知見が得られた。