Outil Échantillon

L'outil Échantillon limite le flux de données à un nombre spécifié, un pourcentage ou un ensemble aléatoire de lignes. De plus, l'outil Échantillon applique la configuration sélectionnée aux colonnes choisies pour les regrouper.

Configurer l’outil

  1. Sélectionnez le type d’échantillon. Les options sont les suivantes :
    • N premières lignes : renvoie chaque ligne des données depuis le début des données à travers la ligne N.
    • N dernières lignes : à partir de la ligne qui se trouve à N lignes de la fin des données, retourne chaque ligne jusqu'à la fin des données.
    • Ignorer les N 1ères lignes : retourne toutes les lignes dans les données commençant après la ligne N.
    • 1 de toutes les N lignes: renvoie la première ligne de chaque groupe de N lignes.
    • 1 sur N chance d'inclure chaque ligne: détermine de façon aléatoire si chaque ligne est incluse dans l'échantillon, indépendamment de l'inclusion de toutes les autres lignes. Cette méthode de sélection implique que N est une approximation.
    • Si vous avez 1 000 lignes, que vous sélectionnez un échantillon aléatoire et spécifiez N comme 10, vous devriez obtenir 100 lignes retournées ; ce nombre peut cependant varier entre 75 et 150 enregistrements renvoyés.
    • Premiers N % de lignes: renvoie N % de lignes. La sélection de cette option nécessite que les données passent deux fois dans l'outil : une fois pour calculer le nombre de lignes et à nouveau pour retourner le pourcentage spécifié de lignes.
  2. Tapez un nombre dans la zone N = pour spécifier la valeur de N.
  3. Grouper par colonne (facultatif) : si un ou plusieurs groupes sont spécifiés, N lignes sont retournées pour chaque groupe.
  4. Si vous choisissez de Regrouper par une colonne nommée Ville, que vous spécifiez N comme 2 et sélectionnez N premières lignes, Alteryx retournera les deux premières lignes pour chaque ville.