Simulation Scoring Tool Icon

Outil Score De Simulation

Version:
2022.3
Last modified: November 04, 2021

L’outil Score de simulation effectue l’échantillonnage à partir d’une approximation de la distribution d’une erreur d’objet modèle. Alors que la notation standard tente de prédire la valeur prédictive moyenne, l’outil Score de simulation tient également compte de la distribution d’erreur pour proposer une plage de valeurs possibles.

Cet outil utilise l’outil R. Sélectionnez options > Télécharger les outils prédictifs et connectez-vous au portail Téléchargements et licences Alteryx pour installer R et les paquets utilisés par l'outil R. Voir Télécharger et utiliser les outils prédictifs.

Connecter les entrées

Méthode d'échantillonnage de la distribution des erreurs

  • En cas de notation d’un modèle LM, la distribution d’erreur peut être directement échantillonnée du fait des propriétés des LM.
  • En cas de notation d’autres modèles (non-LM), on suppose l’homoscédasticité des distributions d’erreur par rapport aux prédicteurs. Cela permet de calculer une distribution d’erreur unique en notant le modèle par rapport à un jeu de validation. Cette distribution d’erreur est ensuite échantillonnée, puis ajoutée aux résultats de la notation des données entrantes.

Avertissement

Ne connectez pas cette entrée lorsque l'objet du modèle entrant utilise un outil de régression linéaire.

  • S ancre: les données de simulation pour marquer. Ce paramètre doit contenir tous les champs (types et noms identiques) utilisés pour créer le modèle prédictif associé.

Configuration de l'outil

  • Résultats nominaux de la simulation de score : Nom de champ pour les résultats générés. Le nom de champ doit commencer par une lettre et peut contenir des lettres, des chiffres ainsi que les caractères spéciaux point (« . ») et trait de soulignement (« _ »). Notez que R respecte la casse.
  • Nombre d'enregistrements à marquer à la fois : L'outil peut décomposer les données d'entrée en morceaux, marquer un morceau à la fois, et ainsi éviter la limitation de traitement de la mémoire De R. Cette option détermine le nombre maximal d’enregistrements entrants contenus dans chaque fragment de données.
  • Combien d'échantillons provenant de la distribution d'erreurs par itération : Nombre de tirages de la distribution d'erreurs du modèle pour chaque enregistrement entrant.
  • Définir random seed: (Facultatif) Spécifiez une graine aléatoire. Cette option est masquée si les données contiennent un champ d’amorce à noter.

Afficher la sortie

  • D ancre: les données à marquer, ainsi que le score simulé.
Cette page vous a-t-elle été utile ?

Vous rencontrez des problèmes avec votre produit Alteryx ? Visitez la communauté Alteryx ou contactez le  support. Vous n'arrivez pas à soumettre ce formulaire ? Envoyez-nous un e-mail.