Skip to main content

Three partially full beakers Outil Échantillon

Exemple d'outil unique

L'outil Échantillon a un exemple d'outil unique. Accédez à la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.

Utilisez l'outil Échantillon pour limiter le flux de données à un nombre spécifié, un pourcentage ou un ensemble aléatoire de lignes. De plus, l'outil Échantillon applique la configuration sélectionnée aux colonnes sélectionnées à grouper par.

Configuration de l'outil

  1. Sélectionnez le type d’échantillon. Les options sont les suivantes :

    • N premières lignes : retourne chaque ligne des données depuis le début des données jusqu’à la ligne N.

    • N dernières lignes : à partir de la ligne qui se trouve à N lignes de la fin des données, retourne toutes les lignes jusqu’à la fin des données.

    • Ignorer les N 1ères lignes : retourne toutes les lignes des données à partir de la ligne N.

    • 1 de chaque N lignes : retourne la première ligne de chaque groupe de N lignes.

    • 1 sur N chance d'inclure chaque ligne : détermine de façon aléatoire si chaque ligne est incluse dans l'échantillon, indépendamment de l'inclusion de toutes les autres lignes. Cette méthode de sélection implique que N est une approximation.

      Note

      Si vous avez 1 000 lignes, sélectionnez un échantillon aléatoire et indiquez la valeur 10 pour N. Vous devriez obtenir 100 lignes. Toutefois, vous pouvez obtenir entre 75 et 150 enregistrements.

    • Premier N% de lignes  : retourne N pour cent de lignes. Cette option nécessite que les données passent deux fois dans l'outil : une fois pour calculer le nombre de lignes et une autre fois pour retourner le pourcentage spécifié de lignes.

  2. Saisissez un nombre dans la zone N= pour spécifier la valeur de N.

  3. Regrouper par colonne (facultatif) : si un ou plusieurs groupes sont spécifiés, N lignes sont retournées pour chaque groupe.

    Note

    Si vous sélectionnez de regrouper par une colonne appelée City (ville), que vous indiquez 2 pour la valeur de N et sélectionnez N premières lignes, Alteryx renvoie les 2 premières lignes pour chaque Ville.