
Outil Échantillonnage De Simulation
Version:
2023.1
Last modified: November 02, 2021
L’outil Échantillonnage de simulation échantillonne les données en fonction des paramètres à partir d’une distribution, à partir de données d’entrée ou sous la forme d’une combinaison convenant le mieux à une distribution. Les données peuvent également être « dessinées » si vous n’êtes pas certain des paramètres d’une distribution et s’il vous manque des données.
Cet outil utilise l’outil R. Sélectionnez options > Télécharger les outils prédictifs et connectez-vous au portail Téléchargements et licences Alteryx pour installer R et les paquets utilisés par l'outil R. Voir Télécharger et utiliser les outils prédictifs.
Connecter les entrées
- D ancre: optionnel. Exemples de données. Cette entrée est obligatoire si vous effectuez l’échantillonnage à partir de données brutes ou stockées.
- S ancre: optionnel. Données de simulation. Si d’anciens outils de simulation ont été utilisés, les données provenant de ces outils peuvent être connectées à cette entrée afin d’ajouter ces informations et d’obtenir le comptage des itérations et l’amorce.
Configuration des outils
- Sélectionner le mécanisme d'échantillonnage : Monte Carlo / Simple Échantillonnage ou Latin HyperCube / Stratified Sampling. Pour l’échantillonnage stratifié des données, la taille des strates maximum est déterminée par la taille de fragment choisie.
- Taille de morceau : La taille maximale des données à évaluer à la fois. Ce paramètre permet d’éviter la limite de traitement en mémoire de R. Pour l’échantillonnage stratifié des données, ce paramètre indique également la taille maximale des strates.
- Graine: La graine aléatoire utilisée pour l'échantillonnage. Cette option n’est pas disponible si un jeu de données contenant un champ d’amorce est connecté à l’entrée S, car cette amorce sera incrémentée et utilisée à la place.
- Nombre d'itérations: Nombre d'échantillons à sélectionner. Cette option n’est pas disponible si un jeu de données est connecté à l’entrée S, car la taille de ce jeu de données détermine le nombre d’itérations.
- Sélectionner le mode d’échantillonnage :
- Échantillonner en fonction des paramètres
- Pour l’échantillonnage en fonction des paramètres, ne connectez pas un flux de données à l’entrée D.
- Entrez le nom des données sortantes : Spécifiez un nom de champ pour le champ de sortie.
- Sélectionnez la distribution : Sélectionnez parmi la liste des distributions prises en charge. Avec les paramètres, cette option détermine le tracé de la densité cumulative/fonction de masse décrites.
- Entrez Paramètres et limites : Pour définir les paramètres de la distribution, utilisez les curseurs ou les flèches vers le haut/vers le bas pour ajuster les valeurs ou saisir manuellement les valeurs. Avec la distribution sélectionnée, cette option détermine le tracé de la densité cumulative/fonction de masse décrites. Vous pouvez également, en option, indiquer les limites de la distribution. Si des limites sont spécifiées, l'échantillonnage de rejet est utilisé pour s'assurer que les échantillons prélevés se trouvent entre la limite inférieure et la limite supérieure. Les limites sont inclusives.
- Pour l’échantillonnage en fonction des paramètres, ne connectez pas un flux de données à l’entrée D.
- Échantillonnage à partir des données
- Connectez un flux de données à l’entrée D ou effectuez l’échantillonnage par saisie manuelle.
- Échantillon avec remplacement : Sélectionnez cette option pour échantillonner avec remplacement.
- Spécifiez le type de données : Sélectionnez l'une des options de données.
- Données brutes (non binned): Sélectionnez les champs à échantillonner, puis une stratégie d'échantillonnage (voir ci-dessous).
- Données binées: Nécessite un champ d'id et un champ de valeur avec des bacs à espace également espacés. (les ID sont des nombres espacés à parts égales.) Spécifiez un nom pour les données sortantes (nom du champ de sortie), stratégie d'échantillonnage (voir ci-dessous), champ ID pour les données Binned et le champ valeur pour les données Binned.
- Entrée manuelle: Entrez manuellement des données via un widget Roulette. Entrez un nom pour les données sortantes (nom du champ de sortie) et les paramètres de widget roulette. Utilisez les options Inférieur, Supérieur, Hauteur et Emplacements num pour configurer la taille de la grille. Cliquez dans la grille pour fournir la hauteur des bacs.
- Sélectionnez les champs à échantillonner : Sélectionnez des colonnes pour échantillonner les données.
- Sélectionnez la stratégie d'échantillonnage : Choisissez comment échantillonner vos données. Échantillonnez des lignes entières, chaque colonne indépendamment, ou de la distribution la plus appropriée. Si vous choisissez d’effectuer l’échantillonnage à partir de la distribution du meilleur ajustement, sélectionnez les distributions selon lesquelles ajuster les données.
- Connectez un flux de données à l’entrée D ou effectuez l’échantillonnage par saisie manuelle.
- Échantillonner en fonction des paramètres
Afficher la sortie
Connectez un outil de navigation à l'ancre de sortie pour afficher les résultats.
- D ancre: la sortie de données. Il s’agit du résultat de la simulation.