Préparation

La catégorie Préparation contient des outils préparant les données pour l’analyse aval.

Consultez la série de Maîtrise des outils de la communauté Alteryx pour en savoir plus sur ces outils et les autres.

Outil Champ automatique: L'outil de champ automatique lit dans un fichier d'entrée et définit le type de champ à la plus petite taille possible par rapport aux données contenues dans la colonne.

Outil Créer des échantillons: L'outil créer des exemples fractionne les enregistrements d'entrée en deux ou trois échantillons aléatoires. Spécifiez le pourcentage d'enregistrements qui se trouvent dans les exemples d'estimation et de validation, et si le total est inférieur à 100%, les enregistrements restants tombent dans l'exemple exclusion.

Outil Nettoyage des données: l'outil Nettoyage des données corrige les problèmes courants de qualité des données à l'aide de divers paramètres.

Outil Filtrer: l'outil Filtrer interroge les enregistrements et fractionne les données en deux sorties : vrai (lorsque les données répondent aux critères spécifiés) et faux (lorsque ce n'est pas le cas).

Outil Formule: l'outil Formule crée ou met à jour des colonnes en utilisant une ou plusieurs expressions pour effectuer de multiples calculs ou opérations.

Outil Générer les lignes: L'outil générer des lignes crée de nouvelles lignes de données au niveau de l'enregistrement. Il est utile de créer une séquence de nombres, de transactions ou de dates.

Outil Imputation: L'outil d'imputation met à jour des valeurs spécifiques dans un champ de données numériques avec une autre valeur sélectionnée. Il est utile pour remplacer des valeurs nulles.

Outil Stockage multichamps: L'outil multi-champ binning regroupe plusieurs champs numériques en tuiles ou en bacs, en particulier pour une utilisation dans l'analyse prédictive.

Outil de formule à plusieurs champs: L'outil formule multi-champs facilite l'exécution d'une seule fonction sur plusieurs champs.

Outil Formule à plusieurs lignes: L'outil formule multi-lignes crée ou met à jour une colonne à l'aide d'une expression qui peut référencer des colonnes dans une ligne suivante ou antérieure. Il est utile pour l'analyse des données complexes, et la création de totaux d'exécution, moyennes, pourcentages, et d'autres calculs mathématiques.

Outil Suréchantillonner le champ: L'outil de champ suréchantillon échantillonne les données entrantes de sorte qu'il y ait une représentation égale des valeurs de données afin qu'ils puissent être utilisés efficacement dans un modèle prédictif.

Échantillon % aléatoire: L'outil échantillon aléatoire% retourne un nombre attendu d'enregistrements résultant en un échantillon aléatoire du flux de données entrant.

Outil ID d’enregistrement: L'outil d'identification de l'enregistrement crée une nouvelle colonne dans les données et assigne un identificateur unique, qui augmente séquentiellement, pour chaque enregistrement dans les données.

Outil Échantillon: l'outil Échantillon extrait une partie spécifiée des enregistrements dans le flux de données.

Outil Sélectionner: l'outil Sélectionner inclut, exclut et réordonne les colonnes de données qui transitent par un workflow. Vous pouvez également utiliser cet outil pour modifier le type et la taille des données, renommer une colonne ou ajouter une description.

Outil Sélectionner des enregistrements: L'outil sélectionner les enregistrements sélectionne des enregistrements spécifiques et/ou des plages d'enregistrements, y compris des plages discontinues. Il est utile pour la résolution des problèmes et l’échantillonnage.

Outil Trier: l'outil de tri réorganise les enregistrements d'une table dans l'ordre alphanumérique, en fonction des valeurs des champs de données spécifiés.

Outil Ensemble: L'outil de mosaïque attribue une valeur (mosaïque) basée sur les plages dans les données.

Outil Unique: L'outil unique distingue si un enregistrement de données est unique ou un doublon par regroupement sur un ou plusieurs champs spécifiés, puis le tri sur ces champs. Le premier enregistrement de chaque groupe est envoyé au flux de sortie Unique, tandis que les autres sont envoyés au flux de sortie Doublon.