Outil Score de simulation
Exigences relatives au rôle d'utilisateur
Rôle d'utilisateur* | Accès aux outils/fonctionnalités |
|---|---|
Utilisateur complet | ✓ |
Utilisateur de base | X |
*S'applique aux clients Alteryx OneÉditions Professional et Enterprise sur les versions 2025.1 et ultérieures de Designer.
L’outil Score de simulation effectue l’échantillonnage à partir d’une approximation de la distribution d’une erreur d’objet modèle. Alors que la notation standard tente de prédire la valeur prédictive moyenne, l’outil Score de simulation tient également compte de la distribution d’erreur pour proposer une plage de valeurs possibles.
Important
Cet outil n'est pas installé automatiquement avec Designer. Pour l'utiliser, téléchargez et installez les outils prédictifs Alteryx pour votre version de Alteryx Designer. En fonction de votre type de compte Alteryx, vous disposez de deux options de téléchargement :
Télécharger depuis Alteryx One
Télécharger depuis le portail des licences et téléchargements Alteryx.
Pour plus d'informations, consultez la page Télécharger et utiliser les outils prédictifs
Connexion des entrées
Ancrage M : objet modèle produit par un des outils de modélisation prédictifs sous R.
Ancrage V (Facultatif) : jeu de données de validation à utiliser lors de la connexion d'un modèle non linéaire (non LM). Les outils Alteryx qui créent des modèles non LM sont : Régression logistique, Régression de comptage, Régression Gamma, Modèle boosté, Arbre de décision, Modèle de forêt, Classificateur bayésien naïf, Réseau neural, Modèle Spline, Pas à pas et Machine à vecteurs de support.
Méthodologie d’échantillonnage de la distribution d’erreur
En cas de notation d’un modèle LM, la distribution d’erreur peut être directement échantillonnée du fait des propriétés des LM.
En cas de notation d’autres modèles (non-LM), on suppose l’homoscédasticité des distributions d’erreur par rapport aux prédicteurs. Cela permet de calculer une distribution d’erreur unique en notant le modèle par rapport à un jeu de validation. Cette distribution d’erreur est ensuite échantillonnée, puis ajoutée aux résultats de la notation des données entrantes.
Avertissement
Ne connectez pas cette entrée si l'objet modèle entrant utilise un outil Régression linéaire.
Ancrage S : données de simulation à noter. Ce paramètre doit contenir tous les champs (types et noms identiques) utilisés pour créer le modèle prédictif associé.
Configuration de l'outil
Nommer les résultats de la simulation du score : nom du champ pour les résultats générés. Le nom de champ doit commencer par une lettre et peut contenir des lettres, des chiffres ainsi que les caractères spéciaux point (« . ») et trait de soulignement (« _ »). Notez que R respecte la casse.
Nombre d'enregistrements dont le score doit être calculé à la fois : cet outil peut diviser les données d'entrée en fragments, en notant un fragment à la fois et donc en évitant la limite de traitement en mémoire de R. Cette option détermine le nombre maximal d’enregistrements entrants contenus dans chaque fragment de données.
Nombre d'échantillons provenant de la distribution d'erreur par itération : nombre d'éléments extraits de la distribution d'erreur du modèle pour chaque enregistrement entrant.
Définir l'amorce aléatoire (facultatif) : spécifiez une amorce aléatoire. Cette option est masquée si les données contiennent un champ d’amorce à noter.
Visualisation de la sortie
Ancrage D : données à noter, ainsi que le score simulé.
