Skip to main content

Score Tool Outil Évaluation

Exemple d'outil unique

L'outil Évaluation comporte un exemple d'outil unique. Consultez la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.

L'outil Évaluation crée une estimation d'une variable cible en appliquant un modèle R à un ensemble de variables prédictives fournies. Si la variable cible est catégorique, elle fournit des probabilités qu'un enregistrement (basé sur la variable prédictive) appartienne à chaque catégorie. Si la variable cible est continue, il en estime la valeur. Bien qu'il permette d'évaluer les performances du modèle, il ne le fait pas seul.

Cet outil utilise l'outil R. Accédez à Options > Télécharger les outils prédictifs et connectez-vous au Portail de licences et de téléchargements Alteryx pour installer R et les packages utilisés par l'outil R. Consultez la page Télécharger et utiliser les outils prédictifs.

Type de modèle

L’outil Score est capable d’analyser des modèles provenant de divers emplacements :

  • Modèle local : le modèle est ajouté au workflow depuis une machine locale ou consulté dans une base de données.

  • Modèle Promote : le modèle est stocké dans un système de gestion de modèles Promote.

Configurer pour un modèle local

L’outil Score peut utiliser des modèles inclus à un workflow, ou des modèles accessibles à partir de la suite en BDD.

Configurer l'outil pour le traitement standard

Connexion des entrées

L'outil Évaluation nécessite 2 entrées :

  • L’objet modèle produit par un outil prédictif compatible avec le code R.

  • Un flux de données contenant les champs prédicteurs sélectionnés dans la configuration du modèle. Il peut s’agir d’un flux de données Alteryx standard ou d’un flux de métadonnées XDF.

Connectez ces entrées à celle de l’outil Score afin de démarrer la configuration.

Modèles pris en charge

L’outil Score peut utiliser un flux de données issu d’un modèle prédictif, même si l’estimation a été réalisée à l’aide d’une fonction RevoScaleR. L'outil Évaluation peut utiliser un flux de métadonnées XDF uniquement si l'entrée envoyée à l'outil de modélisation provient d'un outil Sortie XDF ou Entrée XDF, et si l'estimation du modèle a été réalisée à l'aide d'une fonction RevoScaleR.

Les modèles estimés par OracleR Enterprise utilisant un outil prédictif en BDD connecté à une source de données Oracle ne peuvent pas être utilisés pour noter un flux de données Alteryx standard. Toutefois les modèles estimés avec un flux de données Alteryx standard peuvent être utilisés pour noter des sources de données Oracle.

Configuration

Ces ajustements ne sont valides que si la cible est une variable catégorielle binaire.

  • Le nouveau nom de champ (cible continue) ou préfixe (cible catégorielle) : le préfixe ou le nom de champ doit commencer par une lettre et peut contenir des lettres, des chiffres, ainsi que les caractères spéciaux suivants : point (« . ») et trait de soulignement (« _ »). Le code R est sensible à la casse.

  • Le champ cible a une valeur suréchantillonnée : ces champs sont utilisés pour régler les probabilités ajustées en fonction des pourcentages d'échantillon réels. Sélectionnez l’option :

    • La valeur du champ cible qui a été suréchantillonné : pour obtenir le nom du champ concerné.

    • Le pourcentage de la valeur suréchantillonnée dans les données d’origine avant le suréchantillonnage : pour obtenir le pourcentage des valeurs qui ont été répétées au cours du suréchantillonage.

  • Options de régression linéaire uniquement non régularisées :

    Modèles créés par ORE

    En vue de ce calcul, si vous utilisez un modèle créé par ORE, la table des estimations d’origine doit être présente dans la base de données.

    • Le champ cible a subi une transformation d'algorithme naturel : sélectionnez cette option pour transformer les valeurs en réappliquant l'échelle d'origine et pour utiliser un estimateur de persistance afin de tenir compte des écarts liés à la transformation.

    • Inclure un intervalle de confiance de prévision : sélectionnez cette option afin de spécifier la valeur utilisée pour calculer les intervalles de confiance.

  • Options spécifiques à l’entrée XDF :

    • Ajouter des scores au fichier XDF d'entrée : sélectionnez cette option pour ajouter des scores au fichier XDF d'entrée, au lieu de les placer dans un flux de données Alteryx.

  • Nombre d'enregistrements dont le score doit être calculé à la fois : sélectionnez le nombre d'enregistrements dans un groupe. Les données en entrée sont traitées groupe par groupe, afin de ne pas dépasser la limite de traitement en mémoire de R.

Configurer l'outil pour le traitement en BDD

L’outil Score prend en charge le traitement en BDD Oracle, Microsoft SQL Server 2016 et Teradata. Visitez Vue d'ensemble des outils en base de données pour plus d'informations sur les outils et la prise en charge en base de données.

Pour accéder à la version en BDD de l’outil Score :

  • Placez un outil en BDD dans le canevas. L’outil Score bascule automatiquement vers la version en BDD.

  • Effectuez un clic droit sur l'outil Évaluation, pointez le curseur sur Sélectionner la version de l'outil, puis sélectionnez la version en BDD.

Consultez la page Analyses prédictives pour en savoir plus sur la prise en charge en base de données prédictive.

Connexion d'une entrée

L'outil Évaluation nécessite 2 entrées :

  • L’objet modèle produit par un outil prédictif compatible avec le code R.

  • Un flux de données contenant les champs prédicteurs sélectionnés dans la configuration du modèle. Il peut s’agir d’un flux de données Alteryx standard ou d’un flux de métadonnées XDF.

Connectez ces entrées à celle de l’outil Score afin de démarrer la configuration.

Modèles pris en charge

L’outil Score peut utiliser un flux de données issu d’un modèle prédictif, même si l’estimation a été réalisée à l’aide d’une fonction RevoScaleR. L'outil Évaluation peut utiliser un flux de métadonnées XDF uniquement si l'entrée envoyée à l'outil de modélisation provient d'un outil Sortie XDF ou Entrée XDF, et si l'estimation du modèle a été réalisée à l'aide d'une fonction RevoScaleR.

Les modèles estimés par ORE utilisant un outil prédictif en BDD connecté à une source de données Oracle ne peuvent pas être utilisés pour noter un flux de données Alteryx standard. Toutefois les modèles estimés avec un flux de données Alteryx standard peuvent être utilisés pour noter des sources de données Oracle.

Configuration

Aucun autre caractère spécial n'est autorisé et R est sensible à la casse.

  • Nom de la table de sortie : saisissez le nom de la table dans laquelle sont enregistrés les résultats dans la base de données.

  • Le nouveau nom de champ (cible continue) ou préfixe (cible catégorielle) : le préfixe ou le nom de champ doit commencer par une lettre et peut contenir des lettres, des chiffres, ainsi que les caractères spéciaux suivants : point (« . ») et trait de soulignement (« _ »).

  • Le champ cible a une valeur suréchantillonnée : ces champs sont utilisés pour régler les probabilités ajustées en fonction des pourcentages d'échantillon réels. Ces ajustements ne sont valides que si la cible est une variable catégorielle binaire. Sélectionnez l’option :

    • La valeur du champ cible qui a été suréchantillonné : pour obtenir le nom du champ concerné.

    • Le pourcentage de la valeur suréchantillonnée dans les données d’origine avant le suréchantillonnage : pour obtenir le pourcentage des valeurs qui ont été répétées au cours du suréchantillonage.

  • Options de régression linéaire uniquement :

    Modèles créés par ORE

    En vue de ce calcul, si vous utilisez un modèle créé par ORE, la table des estimations d’origine doit être présente dans la base de données.

    • Le champ cible a subi une transformation d'algorithme naturel : sélectionnez cette option pour transformer les valeurs en réappliquant l'échelle d'origine et pour utiliser un estimateur de persistance afin de tenir compte des écarts liés à la transformation.

    • Inclure un intervalle de confiance de prévision : sélectionnez cette option afin de spécifier la valeur utilisée pour calculer les intervalles de confiance.

  • Configuration spécifique à Teradata : Microsoft Machine Learning Server doit disposer d'informations supplémentaires concernant la plateforme Teradata à utiliser. Ces informations sont généralement communiquées par un administrateur Teradata local.

    • Chemins de serveur Teradata qui mènent aux exécutables binaires de R.

    • Emplacement des fichiers temporaires utilisé par Microsoft Machine Learning Server.

Source du modèle (Oracle uniquement)

  • Source du modèle : sélectionnez la source de l'objet modèle qui est transmis à l'entrée (M) de l'outil Évaluation. Celui-ci peut se trouver :

    • Dans la base de données (il s’agit de la valeur située dans le champ Nom du flux de données).

    • Dans le champ « Objet » du flux de données.

Visualisation de la sortie

La sortie contient les flux de données d’origine, incluant les valeurs prédictives du modèle. Dans le cas d’un modèle qui utilise une cible catégorielle, une probabilité prédite pour chaque niveau de la variable cible est indiquée dans un nom de champ. Ce dernier inclut le préfixe fourni par l’utilisateur, ainsi que le suffixe correspondant au niveau possible de la variable cible.

Configurer pour un modèle Promote

Promote est une plate-forme permettant le déploiement, la gestion et la mise à l’échelle des modèles prédictifs. Alteryx est capable de s’y connecter afin d’évaluer les modèles qui y sont stockés.

Identifiants de Promote

  • Établissez une Connexion Alteryx Promote.

  • Connexion Alteryx Promote : liste déroulante utilisée pour effectuer un choix parmi les connexions de Promote enregistrées.

  • Ajouter une connexion : option à ajouter à la liste des connexions Promote disponibles. Le gestionnaire de connexion Promote fonctionne indépendamment des workflows.

Ajouter une connexion Promote

  1. Cliquez sur Ajouter une connexion.

  2. Dans la fenêtre Ajouter une connexion, entrez une URL Alteryx Promote , qui pointe vers l’emplacement de stockage de votre modèle.

  3. Sélectionnez Suivant.

  4. Dans la fenêtre Identifiants d'Alteryx Promote, saisissez votre nom d'utilisateur et votre clé API.

  5. Sélectionnez Se connecter.

  6. Si vous êtes connecté, dans la fenêtre Connexion établie, sélectionnez Terminer. La nouvelle connexion est sélectionnée et visible dans la liste déroulante.

Supprimer une connexion Promote

  1. Sélectionnez une connexion disponible.

  2. Sélectionnez Supprimer la connexion.

  3. Dans la fenêtre de confirmation, vérifiez que l'URL et le nom d'utilisateur sont associés à la connexion que vous voulez supprimer.

  4. Sélectionnez ok. La connexion n'est plus disponible dans la liste déroulante.

Accès à Promote

Si vous ignorez si vous avez accès à la fonction Promote ou avez besoin d'aide pour trouver les informations d'identification nécessaires, contactez votre administrateur local ou votre représentant de l'assistance.

Sélection de modèle

Une liste des modèles auxquels vous avez accès est générée. Faites défiler cette liste ou utilisez la fonction de recherche pour localiser le modèle à utiliser, puis sélectionnez le chemin associé.

Une fois le chemin sélectionné, les informations concernant le modèle sont collectées.

  • Nom : nom du modèle.

  • Propriétaire : propriétaire du modèle.

  • Statut : statut du modèle, permettant de connaître sa disponibilité.

    • Online : le modèle est à jour et prêt à traiter des données.

    • Building : le modèle est en cours d'actualisation et n'est pas en mesure de traiter des données.

    • Échec du test de l'unité : le modèle est finalisé, mais certains composants n'ont pas été correctement créés. Le modèle n’est pas en mesure de traiter des données.

    • Failed : le modèle n'a pas été créé correctement et n'est pas en mesure de traiter des données.

    • Offline : le modèle n'a pas été créé et n'est pas en mesure de traiter des données.

  • Last Updated : date et heure de la dernière actualisation du modèle.

Vérifiez que le modèle permet le traitement des données et sélectionnez Terminé.

Résumé de la configuration

Le résumé de la configuration rappelle les identifiants utilisés et fournit une synthèse des informations relatives au modèle sélectionné.