Outil Créer des échantillons

L’outil Créer des échantillons fractionne les enregistrements d’entrée en deux ou trois échantillons aléatoires. Vous pouvez spécifier le pourcentage d’enregistrements devant figurer dans les échantillons d’estimation et de validation. Si le total est inférieur à 100 %, les enregistrements restants sont affectés à l’échantillon des cas d'exclusion.

Configurer l’outil

  1. Échantillon d'estimation pour cent: le pourcentage des données à placer dans l'échantillon d'estimation (entre 1% et 99%).
  2. Validation de l'échantillon pour cent: pourcentage des données à placer dans l'échantillon de validation (entre 1% et 99%).
  3. Graine aléatoire: valeur entière comprise entre 1 et 1000. La modification de cette valeur modifiera l'exemple dans lequel une ligne individuelle des données est placée. Sauf si vous avez une bonne raison d’effectuer cette modification, la valeur par défaut (1) reste recommandée.

Afficher la sortie

Il existe 3 sorties pour l’outil Créer des échantillons :

  • E ancre: le flux de sortie d'estimation contiendra un échantillon aléatoire d'enregistrements d'entrée. Le nombre d’enregistrements dans ce flux est égal au pourcentage du total des enregistrements spécifié dans la propriété Estimation ci-dessus.
  • V ancre: le flux de validation contiendra un échantillon aléatoire d'enregistrements d'entrée. Le nombre d’enregistrements dans ce flux est égal au pourcentage du total des enregistrements spécifié dans la propriété Validation ci-dessus.
  • H ancre: le flux exclusion inclura les restes d'enregistrements qui n'ont pas été placés dans les échantillons d'estimation ou de validation.

Si les enregistrements sont en nombre impair et si les échantillons Estimation et Validation sont définis sur 50 %, le flux de sortie Estimation possèdera un enregistrement de plus que le flux Validation.