Transformation Tool icon

Outil Transformation

Version:
2022.3
Last modified: January 20, 2023

Utilisez l’outil Transformation pour effectuer ces tâches de préparation des données :

  • Définir les types de données.
  • Nettoyer les valeurs manquantes.
  • Sélectionner les caractéristiques.
  • Encoder les données.

Vous pouvez effectuer chacune de ces tâches dans n’importe quel ordre. L'ordre dépend de la façon dont vous voulez préparer les données.

Cet outil fait partie de Alteryx Intelligence Suite. Intelligence Suite nécessite une licence séparée et un programme d'installation complémentaire pour Designer. Après avoir installé Designer, installez Intelligence Suite et commencez votre essai gratuit.

Les outils Transformation doivent être placés entre l’outil Modélisation assistée et l’outil Classification ou Régression.

Définir les types de données

  1. Dans le menu déroulant de la section Transformateur, sélectionnez Définir les types de données.
  2. Dans la section Paramètres, les noms des caractéristiques sont listés dans la colonne Caractéristique. Vous pouvez sélectionner le type de données pour une caractéristique à partir du menu déroulant de la colonne Définir les types de données. Les options sont Numérique, Catégoriel, Booléen et ID.

Nettoyer les valeurs manquantes

  1. Dans le menu déroulant de la section Transformateur, sélectionnez Nettoyer les valeurs manquantes.
  2. Cochez les cases à côté des caractéristiques avec les valeurs manquantes que vous souhaitez nettoyer.
  3. Sélectionnez une méthode que vous souhaitez utiliser pour nettoyer les valeurs manquantes :

 

Remplacer par une moyenne

Si vous sélectionnez cette option, la Modélisation assistée remplacera les valeurs manquantes par la somme de toutes les lignes d'une caractéristique, divisée par le nombre total de lignes. Utilisez cette méthode uniquement pour les valeurs numériques. Cette option est recommandée lorsque vos données ont une distribution normale et ne présentent pas de valeurs aberrantes.

Remplacer par une médiane

Si vous sélectionnez cette option, la Modélisation assistée remplacera les valeurs manquantes par le nombre représentant le point médian dans la distribution de votre caractéristique. Cette option est recommandée lorsque vos données sont asymétriques ou contiennent des valeurs aberrantes.

Remplacer par un mode

Si vous sélectionnez cette option, la Modélisation assistée remplacera les valeurs manquantes par le nombre revenant le plus fréquemment. Cette option est recommandée lorsque la caractéristique contient des valeurs catégorielles et que vous souhaitez la conserver. Vous pouvez aussi utiliser le mode pour renseigner les valeurs numériques manquantes.

Remplacer par une constante

Si vous sélectionnez cette option, la Modélisation assistée lira les champs vides comme s'il s'agissait de valeurs manquantes. Sélectionnez cette option si vous pensez que l'algorithme de modélisation peut trouver une signification dans les valeurs manquantes elles-mêmes, car il est parfois possible de trouver des schémas récurrents dans l'absence de données. Vous pouvez également sélectionner cette option si vous pensez que d'autres méthodes de traitement des données manquantes pourraient biaiser votre modèle.

L’outil ne nettoiera pas les valeurs manquantes pour les caractéristiques avec des cases non cochées. Si une caractéristique contient des valeurs manquantes et que vous ne choisissez pas une méthode de nettoyage, une erreur se produit en aval dans le pipeline de machine learning.

Sélectionner les caractéristiques

  1. Dans le menu déroulant de la section Transformateur, sélectionnez Sélectionner les caractéristiques.
  2. Si vous ne souhaitez pas inclure une caractéristique dans le modèle, décochez la case à côté de son nom.

Encodage one-hot

  1. Dans le menu déroulant de la section Transformateur, sélectionnez Encodage one-hot.
  2. Utilisez le bouton de bascule pour masquer les caractéristiques non-encodables.
  3. Cochez la case à côté des caractéristiques que vous souhaitez encoder en format lisible par la machine.
  4. Utilisez le menu déroulant pour sélectionner la façon dont vous souhaitez que l’outil traite les caractéristiques encodées :
    • L'option Ignorer permet à l’outil Transformation de marquer les données en traitant les valeurs inconnues comme des constantes.
    • L'option Erreur indique à l’outil Transformation de renvoyer une erreur si elle rencontre des valeurs inconnues.
Cette page vous a-t-elle été utile ?

Vous rencontrez des problèmes avec votre produit Alteryx ? Visitez la communauté Alteryx ou contactez le  support. Vous n'arrivez pas à soumettre ce formulaire ? Envoyez-nous un e-mail.