Utilisez l'outil Échantillon pour limiter le flux de données à un nombre spécifié, un pourcentage ou un ensemble aléatoire de lignes. De plus, l'outil Échantillon applique la configuration sélectionnée aux colonnes que vous souhaitez regrouper.
Astuce
Cet outil dispose d'un exemple d'outil unique. Consultez la page Accéder aux exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Designer Cloud.
![]() |
Figure : Outil Échantillon avec ancrages.
L'outil Échantillon dispose de 2 ancrages.
Ancrage d'entrée : utilisez l'ancrage d'entrée pour sélectionner les données que vous souhaitez échantillonner.
Ancrage de sortie : génère les données échantillonnées.
Sélectionnez une méthode d’échantillonnage. N est sélectionné à l'aide de la zone de texte suivant les méthodes d'échantillonnage et est limité à 16 caractères. Les options sont les suivantes :
N premières lignes : renvoie chaque ligne des données de la première à la ligne N.
N dernières lignes : à partir de la ligne qui se trouve à N lignes de la fin des données, retourne chaque ligne jusqu'à la fin des données.
Skip 1st N Rows: Returns all rows in the data starting after row N.
1 de toutes les N lignes sera échantillonnée : renvoie la première ligne de chaque groupe de N lignes.
Premier N% de lignes : retourne N pour cent de lignes. Cette option nécessite que les données passent deux fois dans l'outil : une fois pour calculer le nombre de lignes et une autre fois pour retourner le pourcentage spécifié de lignes.
1 chance sur N d'inclure chaque ligne : détermine de façon aléatoire si chaque ligne est incluse dans l'échantillon, indépendamment de l'inclusion de toutes les autres lignes.
Note
L'option 1 chance sur N d'inclure chaque ligne renvoie une approximation. Par exemple, si vous avez 1 000 lignes, sélectionnez un échantillon aléatoire et indiquez la valeur 10 pour N. L'outil devrait renvoyer 100 lignes. Cependant, entre 75 et 150 lignes pourraient être renvoyées.
Entrez un nombre dans N= pour spécifier la valeur de N.
Échantillonner les enregistrements selonl'ordre : sélectionnez le nom et l'ordre des colonnes à échantillonner.
Colonnes à regrouper par : si des groupes sont spécifiés, N lignes sont retournées pour chaque groupe. Cette option n'est pas disponible pour la méthode d'échantillonnage 1 chance sur N d'inclure chaque ligne.
Note
Si vous choisissez de regrouper par une colonne appelée Ville, que vous indiquez 2 pour la valeur de N et sélectionnez N premières lignes, Designer Cloud renvoie les 2 premières lignes pour chaque ville.