
要約
データ量の急激な指数関数的増加により、さまざまなデータタイプが一気に混在する状況が生じ、有用な情報の不足が深刻化した。本稿では、既存の異なる種類のデータを活用して新たなデータを生成する手法を提示する。データ拡張(Augmentation)とは、追加データを用いてデータセットを追加または変更するプロセスを指す。多様なデータセットに対してさまざまな種類のデータ拡張が行われており、これは複数の機械学習パイプラインにおける前処理ステップで広く利用されている。データ拡張を支援するためのライブラリやパッケージが多数開発されており、これらは一般的に「データ拡張ライブラリ」と呼ばれる。各ライブラリは独自の特徴を備えており、多くの顕著な機能を提供している。本稿では、AugStaticライブラリの軽量化と効率性をさらに高めるための改善を目的としている。AugStaticは、他の画像拡張ライブラリと比較して計算コストが低く、さらに優れた特徴を備えたカスタム構築型の画像拡張ライブラリである。このフレームワークは、NumPy配列やテンソルにも対応しており、幅広い用途に利用可能である。