機械学習におけるエポックは、トレーニング データ セット全体をニューラル ネットワークに 1 回渡す (つまり、順伝播と逆伝播を 1 回実行する) プロセスを表します。たとえば、データセットが 1000 個のサンプルで構成され、モデルがバッチ サイズ 100 を使用してトレーニングされた場合、データセット全体の 1 つのパスを完了するには 10 エポックかかります。
エポックは機械学習モデルのトレーニング プロセスで重要な役割を果たし、目に見えないデータを学習して一般化するモデルの能力に直接関係しています。エポックは、トレーニング データ セット全体に対して学習アルゴリズムが動作する回数を定義するハイパーパラメーターです。エポックが少なすぎるとモデルの適合が不十分になる可能性があり、エポックが多すぎるとモデルの適合が過剰になる可能性があります。
エポック数の決定はモデルのパフォーマンスに大きく影響するため、ニューラル ネットワークの設計において重要なステップです。エポックの数が少なすぎると、モデルがデータ内のパターンを学習するのに十分な時間が取れず、モデルのパフォーマンスが低下する可能性があります。逆に、エポック数が大きすぎる場合、モデルが過剰適合する可能性があります。つまり、トレーニング データ内のノイズから学習し、新しいデータのパフォーマンスに悪影響を及ぼします。
早期に停止することは、過学習を防ぐための実用的なテクニックです。これには、検証セット上のモデルのパフォーマンスを監視し、パフォーマンスが低下し始めた場合、または改善できなかった場合にトレーニング プロセスを停止することが含まれます。このアプローチは、実行するエポック数の適切なバランスを見つけて、モデルが過小適合または過適合にならないようにするのに役立ちます。
要約すると、エポックはニューラル ネットワークやその他の機械学習アルゴリズムのトレーニング プロセスの基本的な部分です。これらは、データセット全体がアルゴリズムを通過した回数を表します。モデルが過学習せずに効果的に学習するには、正しいエポック数が重要です。強力な機械学習モデルを構築するには、エポック数と、バッチ サイズや学習率などの他のハイパーパラメーターのバランスをとることが重要です。
【1】https://deepai.org/machine-learning-glossary-and-terms/epoch
【2】https://encord.com/glossary/epochs-definition/