
Outil Évaluation
L'outil de score crée une estimation d'une variable cible en appliquant un modèle R à un ensemble de variables prédictives fournies. Si la variable cible est catégorique, elle fournit des probabilités qu'un enregistrement (basé sur la variable Predictor) appartient à chaque catégorie. Si la variable cible est continue, elle estime la valeur de la variable cible. Bien qu'il puisse être utilisé pour évaluer les performances du modèle, il ne le fait pas seul.
Cet outil utilise l'outil R. Accédez à Options > Téléchargez des outils prédictifs et connectez-vous au portail Téléchargements et licences Alteryx pour installer R et les packages utilisés par l’outil R. Voir Télécharger et utiliser des outils prédictifs.
Type de modèle
L'outil Score permet d'évaluer les modèles à partir d'un certain nombre d'emplacements :
- Modèle local: le modèle est extrait dans le workflow à partir d'un ordinateur local ou est accessible dans une base de données.
- Promouvoirle modèle: le modèle est stocké dans le système de gestion de modèle de promotion.
Configurer pour un modèle local
L'outil Score peut être configuré pour les modèles accessibles par un flux de travail standard ou pour les modèles accessibles à l'aide de la suite In-DB.
Configurer l'outil pour le traitement standard
Connecter les entrées
L'outil Score nécessite deux entrées :
- L'objet modèle produit dans un outil prédictif basé sur R.
- Un flux de données contenant les champs prédicteurs sélectionnés dans la configuration du modèle. Il peut s’agir d’un flux de données Alteryx standard ou d’un flux de métadonnées XDF.
Connectez ces entrées à l'entrée de l'outil Score pour commencer la configuration.
Modèles pris en charge
L'outil Score peut utiliser un flux de données à partir d'un modèle prédictif, même s'il a été estimé à l'aide d'une fonction RevoScaleR. L’outil Score ne peut utiliser un flux de métadonnées XDF que si l’entrée de l’outil de modélisation provient d’un outil de sortie XDF ou d’un outil d’entrée XDF et que le modèle a été estimé à l’aide d’une fonction RevoScaleR.
Les modèles estimés par Oracle R Enterprise à l'aide d'un outil prédictif In-DB connecté à une source de données Oracle ne peuvent pas être utilisés pour marquer un flux de données Alteryx standard, bien que les modèles estimés avec un flux de données Alteryx standard puissent être utilisés pour marquer des sources de données Oracle.
Configuration
Ces ajustements ne sont valides que si la cible est une variable catégorielle binaire.
- Le nouveau nom de champ (cible continue) ou préfixe (cible catégorique) : Le nom ou le préfixe de champ doit commencer par une lettre et peut contenir des lettres, des nombres et la période de caractères spéciaux (« » et souligner (« » . Le code R est sensible à la casse.
- Le champ cible a une valeur suréchantillonnée: ces champs sont utilisés pour ajuster les probabilités ajustées pour correspondre aux vrais pourcentages d'échantillon. Sélectionnez l’option :
- La valeur du champ cible qui a été suréchantillonné », pour obtenir le nom du champ concerné.
- Le pourcentage de la valeur suréchantillonnée dans les données d’origine avant le suréchantillonnage », pour obtenir le pourcentage des valeurs qui ont été répétées au cours du suréchantillonage.
- Options de régression linéaire uniquement non régularisées :
Modèles minerai-créés
En vue de ce calcul, si vous utilisez un modèle créé par ORE, la table des estimations d’origine doit être présente dans la base de données.
- Le champ cible a été transformé en journal naturel: sélectionnez pour appliquer une transformation qui adapte les valeurs à l'échelle d'origine et pour utiliser un estimateur de frottage pour tenir compte du biais de transformation subséquente.
- Incluez un intervalle de confiancede prédiction: sélectionnez pour spécifier la valeur utilisée pour calculer les intervalles de confiance.
- Options spécifiques à l’entrée XDF :
- Annexez les scores au fichier XDF d'entrée : sélectionnez pour ajouter les scores au fichier XDF d'entrée au lieu de les placer dans un flux de données Alteryx.
- Nombre d'enregistrements à marquer à la fois : sélectionnez le nombre d'enregistrements dans un groupe. Les données d'entrée sont notées un groupe à la fois pour éviter la limitation du traitement en mémoire de R.
Configurer l'outil de traitement dans la base de données
L'outil Score prend en charge oracle, Microsoft SQL Server 2016 et Teradata dans le traitement de base de données. Voir Vue d’ensemble de la base de données pour plus d’informations sur le support et les outils dans la base de données.
Pour accéder à la version In-DB de l'outil Score :
- Placez un outil In-DB sur la toile. L'outil Score passe automatiquement à la version In-DB.
- Cliquez à droite sur l'outil Score, pointez pour choisir la version outil et sélectionnez la version In-DB.
Voir Predictive Analytics pour plus d’informations sur la prise en charge prédictive dans la base de données.
Connecter une entrée
L'outil Score nécessite deux entrées :
- L'objet modèle produit dans un outil prédictif basé sur R.
- Un flux de données contenant les champs prédicteurs sélectionnés dans la configuration du modèle. Il peut s’agir d’un flux de données Alteryx standard ou d’un flux de métadonnées XDF.
Connectez ces entrées à l'entrée de l'outil Score pour commencer la configuration.
Modèles pris en charge
L'outil Score peut utiliser un flux de données à partir d'un modèle prédictif, même s'il a été estimé à l'aide d'une fonction RevoScaleR. L’outil Score ne peut utiliser un flux de métadonnées XDF que si l’entrée de l’outil de modélisation provient d’un outil de sortie XDF ou d’un outil d’entrée XDF et que le modèle a été estimé à l’aide d’une fonction RevoScaleR.
Les modèles estimés par ORE à l'aide d'un outil prédictif In-DB connecté à une source de données Oracle ne peuvent pas être utilisés pour marquer un flux de données Alteryx standard, bien que les modèles estimés avec un flux de données Alteryx standard puissent être utilisés pour marquer des sources de données Oracle.
Configuration
Aucun autre caractère spécial n’est autorisé et R est sensible à la casse.
- Nom de la table de sortie: saisissez le nom de la table dans laquelle les résultats sont enregistrés dans la base de données.
- Le nouveau nom de champ (cible continue) ou préfixe (cible catégorique) : Le nom ou le préfixe de champ doit commencer par une lettre et peut contenir des lettres, des nombres et la période de caractères spéciaux (« » et souligner (« » .
- Le champ cible a une valeur suréchantillonnée: ces champs sont utilisés pour ajuster les probabilités ajustées pour correspondre aux vrais pourcentages d'échantillon. Ces ajustements ne sont valides que si la cible est une variable catégorielle binaire. Sélectionnez l’option :
- La valeur du champ cible qui a été suréchantillonné », pour obtenir le nom du champ concerné.
- Le pourcentage de la valeur suréchantillonnée dans les données d’origine avant le suréchantillonnage », pour obtenir le pourcentage des valeurs qui ont été répétées au cours du suréchantillonage.
- Options de régression linéaire uniquement :
Modèles minerai-créés
En vue de ce calcul, si vous utilisez un modèle créé par ORE, la table des estimations d’origine doit être présente dans la base de données.
- Le champ cible a été transformé en journal naturel: sélectionnez pour appliquer une transformation qui adapte les valeurs à l'échelle d'origine et pour utiliser un estimateur de frottage pour tenir compte du biais de transformation subséquente.
- Incluez un intervalle de confiancede prédiction: sélectionnez pour spécifier la valeur utilisée pour calculer les intervalles de confiance.
- Teradata configuration spécifique: Microsoft machine learning Server nécessite des informations de configuration supplémentaires sur la plate-forme Teradata spécifique à utiliser. Ces informations sont généralement communiquées par un administrateur Teradata local.
- Les chemins qui, sur le serveur Teradata, mènent aux exécutables binaires de R ;
- Le fichier temporaire écrire l'emplacement qui est utilisé par Microsoft Machine Learning Server.
Source du modèle (Oracle uniquement)
- Source du modèle : Sélectionnez la source de l'objet modèle qui est transmis dans l'entrée (M) de l'outil Score. Celui-ci peut se trouver :
- Dans la base de données (il s’agit de la valeur située dans le champ Nom du flux de données).
- Dans le champ Objet du flux de données.
Afficher la sortie
La sortie contient les flux de données d’origine, incluant les valeurs prédictives du modèle. Dans le cas d’un modèle qui utilise une cible catégorielle, une probabilité prédite pour chaque niveau de la variable cible est indiquée dans un nom de champ. Ce dernier inclut le préfixe fourni par l’utilisateur, ainsi que le suffixe correspondant au niveau possible de la variable cible.
Configurer pour un modèle Promote
Promote est une plate-forme permettant le déploiement, la gestion et la mise à l’échelle des modèles prédictifs. Alteryx peut se connecter à la plate-forme Promote pour accéder aux modèles stockés et marquer contre eux.
Identifiants de Promote
- Établir une connexion de promotion Alteryx.
- Alteryx Promouvoir la connexion : Liste déroulante utilisée pour sélectionner parmi les connexions Promouvoir enregistrées.
- Ajouter une connexion : Une option à ajouter à la liste des connexions Promouvoir disponibles. Le gestionnaire de connexion Promote fonctionne indépendamment des workflows.
Ajouter une connexion De promote
- Cliquez sur Ajouter une connexion.
- Dans la fenêtre Ajouter une connexion, entrez une URL Alteryx Promote, une URL qui pointe vers l’emplacement où votre modèle est stocké.
- Cliquez sur Suivant.
- Dans la fenêtre Informations d’identification de promotion d’Alteryx, tapez votre nom d’utilisateur et votre clé API.
- Cliquez sur Connecter.
- En cas de succès, dans la fenêtre Connexion établie, sélectionnez Terminer. La nouvelle connexion est sélectionnée et visible dans la liste déroulante.
Supprimer une connexion de promotion
- Sélectionnez une connexion disponible.
- Cliquez sur Supprimer la connexion.
- Dans la fenêtre de Confirmation, vérifiez que l’URL et le nom d’utilisateur sont associés à la connexion que vous voulez supprimer.
- Cliquez sur OK. La connexion n'est plus disponible dans la liste déroulante.
Promouvoir l'accès
Si vous n'êtes pas certain d'avoir accès à la fonction Promouvoir ou si vous avez besoin d'aide pour trouver les informations d'identification requises, communiquez avec votre administrateur local ou votre représentant de soutien.
Sélection d’un modèle
Une liste des modèles auxquels vous avez accès est générée. Faites défiler la liste ou utilisez la fonction de recherche pour trouver le modèle que vous souhaitez marquer et sélectionner le chemin du modèle.
Une fois le chemin sélectionné, les informations concernant le modèle sont collectées.
- Nom: Le nom du modèle.
- Propriétaire : Le propriétaire du modèle.
- État: L’état actuel du modèle, reflétant son accessibilité.
- En ligne: Le modèle est à jour et prêt à traiter les données.
- Bâtiment: Le modèle est actuellement mis à jour et ne peut pas traiter les données.
- Échec du test d’unité : Modèle de construction fini, mais les composants n’ont pas réussi à construire correctement. Le modèle n’est pas en mesure de traiter des données.
- Échec : Le modèle n’a pas réussi à construire correctement et ne peut pas traiter les données.
- Hors connexion : Le modèle n’a pas été construit et ne peut pas traiter les données.
- Dernière mise à jour : L’horodatage de la dernière génération de modèle.
Vérifier que le modèle est disponible pour le traitement des données et sélectionnez Fait.
Résumé de la configuration
Le Résumé de configuration fournit un résumé des informations d'identification utilisées et le résumé du modèle sélectionné.