Outil Échantillonnage de simulation
L’outil Échantillonnage de simulation échantillonne les données en fonction des paramètres à partir d’une distribution, à partir de données d’entrée ou sous la forme d’une combinaison convenant le mieux à une distribution. Les données peuvent également être « dessinées » si vous n’êtes pas certain des paramètres d’une distribution et s’il vous manque des données.
Cet outil utilise l’outil R. Allez dans Options > Télécharger les outils prédictifs et connectez-vous à la Portail Téléchargements et licences Alteryx pour installer l’outil R et les packages utilisés par ce dernier. Reportez-vous à la page Outil R. Voir Télécharger et utiliser les outils prédictifs.
Connecter les entrées
- D ancre: optionnel. Exemples de données. Cette entrée est obligatoire si vous effectuez l’échantillonnage à partir de données brutes ou stockées.
- S ancre: optionnel. Données de simulation. Si d’anciens outils de simulation ont été utilisés, les données provenant de ces outils peuvent être connectées à cette entrée afin d’ajouter ces informations et d’obtenir le comptage des itérations et l’amorce.
Configurer l’outil
- Sélectionner le mécanisme d'échantillonnage: Monte Carlo/échantillonnage simple ou hypercube latin/échantillonnage stratifié. Pour l’échantillonnage stratifié des données, la taille des strates maximum est déterminée par la taille de fragment choisie.
- Tailledu segment: taille maximale des données à évaluer à la fois. Ce paramètre permet d’éviter la limite de traitement en mémoire de R. Pour l’échantillonnage stratifié des données, ce paramètre indique également la taille maximale des strates.
- Graine: graine aléatoire utilisée pour l'échantillonnage. Cette option n’est pas disponible si un jeu de données contenant un champ d’amorce est connecté à l’entrée S, car cette amorce sera incrémentée et utilisée à la place.
- Nombre d'itérations: nombre d'échantillons à sélectionner. Cette option n’est pas disponible si un jeu de données est connecté à l’entrée S, car la taille de ce jeu de données détermine le nombre d’itérations.
- Sélectionner le mode d'échantillonnage:
- Entrez le nom des données sortantes: spécifiez un nom de champ pour le champ de sortie.
- Sélectionnez distribution: sélectionnez dans la liste des distributions prises en charge. Avec les paramètres, cette option détermine le tracé de la densité cumulative/fonction de masse décrites.
- Entrez les paramètres et les limites: pour définir les paramètres de la distribution, utilisez les curseurs ou les flèches haut/bas pour ajuster les valeurs ou saisir manuellement les valeurs. Avec la distribution sélectionnée, cette option détermine le tracé de la densité cumulative/fonction de masse décrites. Vous pouvez également, en option, indiquer les limites de la distribution. Si des limites sont spécifiées, l'échantillonnage de rejet est utilisé pour s'assurer que les échantillons prélevés se trouvent entre la limite inférieure et la limite supérieure. Les limites sont inclusives.
- Échantillon avec remplacement: sélectionnez cette option pour échantillonner avec le remplacement.
- Spécifier type de données: sélectionnez l'une des options de données.
- Données brutes (non Binned): sélectionnez les champs à échantillonner, puis une stratégie d'échantillonnage (voir ci-dessous).
- Données Binned: requiert un champ ID et un champ valeur avec des emplacements à espacement égal. (les ID sont des nombres espacés à parts égales.) Spécifiez un nom pour les données sortantes (nom du champ de sortie), stratégie d'échantillonnage (voir ci-dessous), champ ID pour les données Binned et le champ valeur pour les données Binned.
- Entrée manuelle: saisissez manuellement les données via un widget de roulette. Entrez un nom pour les données sortantes (nom du champ de sortie) et les paramètres de widget roulette. Utilisez les options Inférieur, Supérieur, Hauteur et Emplacements num pour configurer la taille de la grille. Cliquez dans la grille pour fournir la hauteur des bacs.
- Sélectionnez les champs à échantillonner: sélectionnez des colonnes pour échantillonner des données.
- Sélectionnez la stratégied'échantillonnage: choisissez la façon d'échantillonner vos données. Échantillonnez des lignes entières, chaque colonne indépendamment, ou de la distribution la plus appropriée. Si vous choisissez d’effectuer l’échantillonnage à partir de la distribution du meilleur ajustement, sélectionnez les distributions selon lesquelles ajuster les données.
Pour l’échantillonnage en fonction des paramètres, ne connectez pas un flux de données à l’entrée D.
Connectez un flux de données à l’entrée D ou effectuez l’échantillonnage par saisie manuelle.
Afficher la sortie
Connectez un outil de navigation à l'ancre de sortie pour afficher les résultats.
- D ancre: la sortie de données. Il s’agit du résultat de la simulation.