Outil Imputation

L’outil Imputation vous permet de remplacer une valeur spécifique dans un ou plusieurs champs de données numériques par une autre valeur donnée.

Un cas d’utilisation classique consiste à remplacer toutes les valeurs NULL() par la moyenne des valeurs restantes pour les champs values Q1_Sales et Q2_Sales, de sorte que les valeurs NULL() n’affectent pas le résultat final du modèle de prévision.

Configurer l’outil

  1. Champs à imputer: sélectionnez les champs que vous souhaitez mettre à jour.
  2. Valeur entrante à remplacer: spécifiez l'un des deux choix.
    • Null()
    • Valeur spécifiée parl'utilisateur: utilisez la zone de texte pour entrer une valeur.
  3. Remplacer par valeur: spécifiez l'un des quatre choix.
    • Moyenne: moyenne de toutes les valeurs, sans inclure la «valeur entrante à remplacer».
    • Médiane: valeur séparant la moitié supérieure de la moitié inférieure, ou la valeur "Middle".
    • Mode: valeur qui apparaît le plus souvent.  
    • Valeur spécifiée parl'utilisateur: utilisez la zone de texte pour entrer une valeur.
  4. Inclure le champ indicateur de valeur imputée: ajoutez un champ spécifiant si une valeur a été imputée ou non.
  5. Sortie des valeurs imputées sous la forme d'un champ distinct: laissez le champ d'origine pour imputer tel quel et ajoutez un nouveau champ pour la valeur imputée.  

Afficher la sortie

La sortie par défaut inclut le flux de données d’origine avec les valeurs imputées incorporées dans les données d’origine.

Si inclure le champ indicateur de valeur imputée est sélectionné, il y aura un champ supplémentaire à côté de chaque champ sélectionné pour l'imputation avec le préfixe comme nom de champ d'origine et un suffixe de "_Indicator".

Si les valeurs imputées de sortie comme un champ distinct est sélectionné, il y aura un champ supplémentaire à côté de chaque champ sélectionné pour l'imputation avec le préfixe comme nom de champ d'origine et un suffixe de "_ImputedValue".