
Outil Diagramme De Lift
L'outil Lift Chart produit un graphique de réponse capturé cumulatif (également appelé graphique des gains) et un graphique de taux de réponse incrémental qui est utilisé pour évaluer visuellement l'exactitude comparative des différents modèles de classification binaires (oui/non) pour prédire les nouvelles données et d'évaluer les répercussions économiques attendues de l'utilisation d'un modèle prédictif dans un processus d'affaires.
Ces deux diagrammes reposent sur l’agrégation de données en 10 groupes (déciles) dont l’ordre varie selon la probabilité prévue d’une réponse favorable pour chaque modèle, puis sur la comparaison de cette réponse à la situation prévue en cas de sélection aléatoire de prospects. Dans le cas du diagramme cumulatif de réponses, le diagramme examine le pourcentage de réponses totales obtenues si tous les clients de la base de données d’une organisation étaient contactés, en contactant les 10 pour cent, 20 pour cent, etc., les plus pertinents, selon les prévisions du modèle. L'axe x (horizontal) du graphique est le pourcentage de la base de données contactée, tandis que l'axe y (vertical) est le pourcentage de la réponse totale capturée en allant jusqu'à ce « meilleur » décile de la base de données basé sur le modèle.
Par exemple, les 20 pour cent de prospects les plus pertinents en fonction du modèle peuvent représenter 50 pour cent de la réponse favorable qui serait obtenue si tous les prospects étaient contactés. Le diagramme du taux de réponse incrémentiel indique le taux de réponse favorable pour chaque groupe de déciles par modèle dans la base de données. En outre, l'outil produit un tableau des gains et des mesures de la zone sous la courbe et le coefficient de Gini pour fournir des mesures comparatives globales de la performance des différents modèles lorsque l'option de graphique de réponse capturée cumulative est sélectionnée, et un tableau de taux de réponse à différents déciles pour chaque modèle lorsque l'option de taux de réponse différentielle est sélectionnée.
Cet outil utilise l’outil R. Accédez à Options > Téléchargez des outils prédictifs et connectez-vous au portail Téléchargements et licences Alteryx pour installer R et les packages utilisés par l’outil R. Voir Télécharger et utiliser des outils prédictifs.
Connecter les entrées
L’outil nécessite...
- Modèles de classification binaire, tels que l’outil Réseau Neuronal, l’outil de régression logistique, l’outil Arbre de décision, l’outil Modèle de forêt, l’outil Modèle boosté,l’outil Spline Modelou l’outil Stepwise qui ont été syndiqués en un seul flux de données.
- Un flux de données Alteryx ou xDF flux de métadonnées qui est compatible avec l'objet modèle (en termes de noms de champ et les types de champ), et ont tous la même variable cible binaire.
Configurer l'outil
Onglet Configuration
- Type de graphique de levage: sélectionnez le graphique de réponse cumulative total ou le graphique de taux de réponse incrémentiel.
- Taux de réponse réel (devrait être compris entre 0 et 1): Souvent, la base de données utilisée pour construire un modèle prédictif a été « suréchantée » afin d’augmenter le pourcentage d’observations qui ont l’une des deux catégories de réponse cibles. En spécifiant le taux de réponse réel (original) de la variable cible, le graphique de levage construit tiendra compte du suréchantillonnage d'un niveau de la cible. S’il n’y a pas de suréchantillonnage, la valeur de cette option doit correspondre au taux de réponse de la base de données utilisée pour développer les modèles.
- Niveau cible (l’étiquette pour la réponse souhaitée de la variable cible): Cette option permet la création d’un graphique de levage compatible avec le contexte de décision et permet de vérifier les erreurs pour s’assurer que le graphique créé est pertinent.
- Exemple de nom (facultatif): Cette option permet à l’utilisateur de placer une étiquette sur le graphique créé indiquant quel exemple dans le flux de données a été utilisé pour créer le graphique, ou de fournir d’autres informations les vues de l’artisan de données comme pertinentes au graphique.
- Nombre d’enregistrements à lire en même temps: utiliser pour limiter le nombre d’enregistrements extraits du flux de données à la fois.
Onglet Options graphiques
- Taille de l’intrigue: Configurer la taille de l’intrigue en pouces ou centimètres.
- Résolution graphique: Sélectionnez la résolution du graphique en points par pouce : 1x (96 dpi), 2x (192 dpi) ou 3x (288 dpi).
- Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur.
- Une résolution élevée produit un fichier de plus grande taille avec une qualité d’impression supérieure.
- Taille de police de base (points): Configurer la taille de la police.
Afficher la sortie
La sortie de l'outil est un champ de rapport Alteryx qui se compose d'un R-Graph et d'une table Lift/gains. Ces éléments peuvent servir à aider à créer des rapports personnalisés.