Rétention
Méthode d'exclusionIl s’agit d’une méthode d’évaluation de modèle qui divise l’ensemble de données D en deux ensembles mutuellement exclusifs. En supposant qu'un ensemble est l'ensemble d'apprentissage S et l'autre l'ensemble de test T, nous avons :
D = S ∪ T , S ∩ T = ∅
La division des ensembles d’entraînement/de test doit maintenir la distribution des données aussi cohérente que possible. Afin d’éviter le biais supplémentaire introduit dans le processus de division des données affectant les résultats, un échantillonnage stratifié est généralement utilisé.
Étant donné que différentes méthodes de division conduiront à des ensembles d’entraînement/de test différents, les résultats d’évaluation du modèle correspondant seront également différents. Par conséquent, les résultats d’estimation d’une seule utilisation de la méthode de maintien sont généralement peu fiables. Cela nécessite généralement plusieurs divisions aléatoires, des évaluations expérimentales répétées et la valeur moyenne est prise comme résultat de l'évaluation.