Outil Diagramme de lift

Le diagramme de lift génère un diagramme cumulatif des réponses recueillies (également appelé « diagramme de gains ») et un diagramme du taux de réponse incrémentiel, qui permettent d’effectuer une évaluation visuelle de la précision comparative de différents modèles de classification binaire (oui/non) dans le but de prédire de nouvelles données, ainsi qu’une évaluation des implications économiques attendues de l’utilisation d’un modèle prédictif dans le cadre d’un processus commercial.

Ces deux diagrammes reposent sur l’agrégation de données en 10 groupes (déciles) dont l’ordre varie selon la probabilité prévue d’une réponse favorable pour chaque modèle, puis sur la comparaison de cette réponse à la situation prévue en cas de sélection aléatoire de prospects. Dans le cas du diagramme cumulatif de réponses, le diagramme examine le pourcentage de réponses totales obtenues si tous les clients de la base de données d’une organisation étaient contactés, en contactant les 10 pour cent, 20 pour cent, etc., les plus pertinents, selon les prévisions du modèle. L’axe X (horizontal) du diagramme correspond au pourcentage de la base de données contacté, tandis que l’axe Y (vertical) correspond au pourcentage de réponses totales capturées en atteignant ce décile le plus pertinent de la base de données en fonction du modèle.

Par exemple, les 20 pour cent de prospects les plus pertinents en fonction du modèle peuvent représenter 50 pour cent de la réponse favorable qui serait obtenue si tous les prospects étaient contactés. Le diagramme du taux de réponse incrémentiel indique le taux de réponse favorable pour chaque groupe de déciles par modèle dans la base de données. En outre, l’outil génère une table de gains et des mesures de la zone sous la courbe, ainsi que le coefficient de Gini pour fournir des métriques de comparaison globales des performances des différents modèles lorsque l’option de diagramme cumulatif des réponses recueillies est sélectionnée, et une table de taux de réponse aux différents déciles pour chaque modèle lorsque l’option de taux de réponse incrémentiel est sélectionnée.

Cet outil utilise l’outil R. Allez dans Options > Télécharger les outils prédictifs et connectez-vous à la Portail Téléchargements et licences Alteryx pour installer l’outil R et les packages utilisés par ce dernier. Reportez-vous à la page Outil R. Voir Télécharger et utiliser les outils prédictifs.

Connecter les entrées

L'outil nécessite:

modèles de classification binaire, tels que le Outil Réseau neural, Outil Régression logistique, Outil Arbre de décision, Outil Modèle de forêt, Outil Modèle boosté, Outil Modèle Spline, ou Outil Pas à pas qui ont été syndiqués ensemble dans un seul flux de données,

un flux de données Alteryx ou un flux de métadonnées XDF cohérent avec l'objet modèle (en termes de noms de champs et de types de champs), et tous ont la même variable cible binaire.

Configurer l’outil

  • Type de diagrammede levage: sélectionnez le tableau des réponses cumulatives totales ou le graphique du taux de réponse incrémentielle .
  • Taux de réponse réel (devrait être compris entre 0 et 1): souvent, la base de données utilisée pour construire un modèle prédictif a été «suréchantillonnée» pour augmenter le pourcentage d'observations qui ont l'une des deux catégories de réponse cibles. En déterminant le taux de réponse vraie (originale) de la variable cible, le diagramme de lift construit tient compte du suréchantillonnage d’un niveau de la cible. En cas d’absence de suréchantillonnage, la valeur de cette option devrait correspondre au taux de réponse de la base de données utilisée pour développer le ou les modèles.
  • Niveau cible (l'étiquette de la réponse souhaitée de la variable cible): cette option permet la création d'un tableau de levage compatible avec le contexte décisionnel et permet la vérification des erreurs pour s'assurer que le graphique créé est pertinent.
  • Nom de l'exemple (facultatif): cette option permet à l'utilisateur de placer une étiquette sur le graphique créé indiquant quel échantillon dans le flux de données a été utilisé pour créer le graphique, ou de fournir d'autres informations les vues artisan de données comme pertinent pour le graphique.
  • Nombre d'enregistrements à lire en même temps: utiliser pour limiter le nombre d'enregistrements tirés à partir du flux de données à la fois.

Options des graphiques

  • Résolution du graphique : sélectionnez la résolution du graphique en points par pouce : 1x (96 ppp) ; 2x (192 PPP) ; ou 3x (288 PPP). Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur. Une résolution élevée produit un fichier de plus grande taille avec une qualité d’impression supérieure.

Afficher la sortie

La sortie de l'outil est un champ de rapport Alteryx qui se compose d'un R-Graph et d'une table Lift/gains. Ces éléments peuvent servir à aider à créer des rapports personnalisés.