Outil Score de simulation
L’outil Score de simulation effectue l’échantillonnage à partir d’une approximation de la distribution d’une erreur d’objet modèle. Alors que la notation standard tente de prédire la valeur prédictive moyenne, l’outil Score de simulation tient également compte de la distribution d’erreur pour proposer une plage de valeurs possibles.
Cet outil utilise l’outil R. Allez dans Options > Télécharger les outils prédictifs et connectez-vous à la Portail Téléchargements et licences Alteryx pour installer l’outil R et les packages utilisés par ce dernier. Reportez-vous à la page Outil R. Voir Télécharger et utiliser les outils prédictifs.
Connecter les entrées
- M Anchor: objet modèle produit par l'un des outils de modélisation prédictive basés sur R.
- V ancre: optionnel. DataSet de validation à utiliser lors de la connexion d'un modèle non linéaire (non-LM). Les outils Alteryx qui créent des modèles non LM sont Outil Régression logistique,Outil Régression de comptage,Outil Régression Gamma, Outil Modèle boosté,Outil Arbre de décision,Outil Modèle de forêt,Outil Classifieur bayésien naïf, Outil Réseau neural,Outil Modèle Spline,Outil Pas à pasetOutil Machine à vecteurs de support.
- En cas de notation d’un modèle LM, la distribution d’erreur peut être directement échantillonnée du fait des propriétés des LM.
- En cas de notation d’autres modèles (non-LM), on suppose l’homoscédasticité des distributions d’erreur par rapport aux prédicteurs. Cela permet de calculer une distribution d’erreur unique en notant le modèle par rapport à un jeu de validation. Cette distribution d’erreur est ensuite échantillonnée, puis ajoutée aux résultats de la notation des données entrantes.
- S ancre: les données de simulation pour marquer. Ce paramètre doit contenir tous les champs (types et noms identiques) utilisés pour créer le modèle prédictif associé.
Avertissement
Ne connectez pas cette entrée lorsque l'objet de modèle entrant utilise unOutil Régression linéaire.
Configurer l’outil
- Nom résultats de la simulation de score: le nom du champ pour les résultats générés. Le nom de champ doit commencer par une lettre et peut contenir des lettres, des chiffres ainsi que les caractères spéciaux point (« . ») et trait de soulignement (« _ »). Notez que R respecte la casse.
- Nombre d'enregistrements à marquer à la fois: l'outil peut diviser les données d'entrée en segments, marquer un morceau à la fois et éviter ainsi la limitation de traitement en mémoire de R. Cette option détermine le nombre maximal d’enregistrements entrants contenus dans chaque fragment de données.
- Combien d'échantillons de la distribution d'erreur par itération: nombre de tirages à partir de la distribution d'erreurs du modèle pour chaque enregistrement entrant.
- Définir une graine aléatoire: (facultatif) Indiquez une graine aléatoire. Cette option est masquée si les données contiennent un champ d’amorce à noter.
Afficher la sortie
- D ancre: les données à marquer, ainsi que le score simulé.