
Outil Score De Simulation
L’outil Score de simulation effectue l’échantillonnage à partir d’une approximation de la distribution d’une erreur d’objet modèle. Alors que la notation standard tente de prédire la valeur prédictive moyenne, l’outil Score de simulation tient également compte de la distribution d’erreur pour proposer une plage de valeurs possibles.
Cet outil utilise l’outil R. Sélectionnez options > Télécharger les outils prédictifs et connectez-vous au portail Téléchargements et licences Alteryx pour installer R et les paquets utilisés par l'outil R. Voir Télécharger et utiliser les outils prédictifs.
Connecter les entrées
- M Anchor: objet modèle produit par l'un des outils de modélisation prédictive basés sur R.
- V ancre: optionnel. DataSet de validation à utiliser lors de la connexion d'un modèle non linéaire (non-LM). Les outils Alteryx qui créent des modèles non-LM sont Logistic Regression Tool, Count Regression Tool, Gamma Regression Tool, Boosted Model Tool, Decision Tree Tool, Forest Outil modèle, Naive Bayes Classifier Tool, Neural Network Tool, Spline Model Tool, Stepwise Tool, et Support Vector Machine Tool.
Méthode d'échantillonnage de la distribution des erreurs
- En cas de notation d’un modèle LM, la distribution d’erreur peut être directement échantillonnée du fait des propriétés des LM.
- En cas de notation d’autres modèles (non-LM), on suppose l’homoscédasticité des distributions d’erreur par rapport aux prédicteurs. Cela permet de calculer une distribution d’erreur unique en notant le modèle par rapport à un jeu de validation. Cette distribution d’erreur est ensuite échantillonnée, puis ajoutée aux résultats de la notation des données entrantes.
Avertissement
Ne connectez pas cette entrée lorsque l'objet du modèle entrant utilise un outil de régression linéaire.
- S ancre: les données de simulation pour marquer. Ce paramètre doit contenir tous les champs (types et noms identiques) utilisés pour créer le modèle prédictif associé.
Configuration de l'outil
- Résultats nominaux de la simulation de score : Nom de champ pour les résultats générés. Le nom de champ doit commencer par une lettre et peut contenir des lettres, des chiffres ainsi que les caractères spéciaux point (« . ») et trait de soulignement (« _ »). Notez que R respecte la casse.
- Nombre d'enregistrements à marquer à la fois : L'outil peut décomposer les données d'entrée en morceaux, marquer un morceau à la fois, et ainsi éviter la limitation de traitement de la mémoire De R. Cette option détermine le nombre maximal d’enregistrements entrants contenus dans chaque fragment de données.
- Combien d'échantillons provenant de la distribution d'erreurs par itération : Nombre de tirages de la distribution d'erreurs du modèle pour chaque enregistrement entrant.
- Définir random seed: (Facultatif) Spécifiez une graine aléatoire. Cette option est masquée si les données contiennent un champ d’amorce à noter.
Afficher la sortie
- D ancre: les données à marquer, ainsi que le score simulé.