Outil Échantillon
L'outil Échantillon limite le flux de données à un nombre spécifié, un pourcentage ou un ensemble aléatoire de lignes. De plus, l'outil Échantillon applique la configuration sélectionnée aux colonnes choisies pour les regrouper.
Configurer l’outil
- Sélectionnez le type d’échantillon. Les options sont les suivantes :
- N premières lignes : renvoie chaque ligne des données depuis le début des données à travers la ligne N.
- N dernières lignes : à partir de la ligne qui se trouve à N lignes de la fin des données, retourne chaque ligne jusqu'à la fin des données.
- Ignorer les N 1ères lignes : retourne toutes les lignes dans les données commençant après la ligne N.
- 1 de toutes les N lignes: renvoie la première ligne de chaque groupe de N lignes.
- 1 sur N chance d'inclure chaque ligne: détermine de façon aléatoire si chaque ligne est incluse dans l'échantillon, indépendamment de l'inclusion de toutes les autres lignes. Cette méthode de sélection implique que N est une approximation.
- Premiers N % de lignes: renvoie N % de lignes. La sélection de cette option nécessite que les données passent deux fois dans l'outil : une fois pour calculer le nombre de lignes et à nouveau pour retourner le pourcentage spécifié de lignes.
- Tapez un nombre dans la zone N = pour spécifier la valeur de N.
- Grouper par colonne (facultatif) : si un ou plusieurs groupes sont spécifiés, N lignes sont retournées pour chaque groupe.
Si vous avez 1 000 lignes, que vous sélectionnez un échantillon aléatoire et spécifiez N comme 10, vous devriez obtenir 100 lignes retournées ; ce nombre peut cependant varier entre 75 et 150 enregistrements renvoyés.
Si vous choisissez de Regrouper par une colonne nommée Ville, que vous spécifiez N
comme 2 et sélectionnez N premières lignes, Alteryx retournera les deux premières lignes pour chaque ville.