Outil Diagramme de lift
Exemple d'outil unique
L'outil ID d'enregistrement à un exemple d'outil unique. Consultez la page Exemples de workflows pour savoir comment accéder à cet exemple et à de nombreux autres exemples directement dans Alteryx Designer.
Le diagramme de lift génère un diagramme cumulatif des réponses recueillies (également appelé « diagramme de gains ») et un diagramme du taux de réponse incrémentiel, qui permettent d’effectuer une évaluation visuelle de la précision comparative de différents modèles de classification binaire (oui/non) dans le but de prédire de nouvelles données, ainsi qu’une évaluation des implications économiques attendues de l’utilisation d’un modèle prédictif dans le cadre d’un processus commercial.
Ces deux diagrammes reposent sur l’agrégation de données en 10 groupes (déciles) dont l’ordre varie selon la probabilité prévue d’une réponse favorable pour chaque modèle, puis sur la comparaison de cette réponse à la situation prévue en cas de sélection aléatoire de prospects. Dans le cas du diagramme cumulatif de réponses, le diagramme examine le pourcentage de réponses totales obtenues si tous les clients de la base de données d’une organisation étaient contactés, en contactant les 10 pour cent, 20 pour cent, etc., les plus pertinents, selon les prévisions du modèle. L’axe X (horizontal) du diagramme correspond au pourcentage de la base de données contacté, tandis que l’axe Y (vertical) correspond au pourcentage de réponses totales capturées en atteignant ce décile le plus pertinent de la base de données en fonction du modèle.
Par exemple, les 20 pour cent de prospects les plus pertinents en fonction du modèle peuvent représenter 50 pour cent de la réponse favorable qui serait obtenue si tous les prospects étaient contactés. Le diagramme du taux de réponse incrémentiel indique le taux de réponse favorable pour chaque groupe de déciles par modèle dans la base de données. En outre, l’outil génère une table de gains et des mesures de la zone sous la courbe, ainsi que le coefficient de Gini pour fournir des métriques de comparaison globales des performances des différents modèles lorsque l’option de diagramme cumulatif des réponses recueillies est sélectionnée, et une table de taux de réponse aux différents déciles pour chaque modèle lorsque l’option de taux de réponse incrémentiel est sélectionnée.
Cet outil utilise l'outil R. Accédez à OptionsTélécharger les outils prédictifs et connectez-vous au portail Alteryx Downloads and Licenses Portal pour installer R et les paquets utilisés par l'outil R. Consultez Télécharger et utiliser les outils prédictifs.
Connexion des entrées
L'outil nécessite...
Les modèles de classification binaire, tels que outil Réseau neural, outil Régression logistique, outil Arbre de décision, outil Modèle de forêt, outil Modèle boosté, outil Modèle Splineou outil Pas à pas, ont été regroupés en un seul flux de données.
Flux de données Alteryx ou flux de métadonnées XDF cohérent avec l'objet modèle (en termes de noms de champs et de types de champs) et ayant tous la même variable cible binaire.
Configuration de l'outil
Onglet Configuration
Type de graphique de levage: sélectionnez le graphique de réponse cumulée totale ou le graphique de taux de réponse incrémentiel.
La base de données utilisée pour construire un modèle prédictif est souvent « suréchantillonnée » pour augmenter le pourcentage d’observations présentant l’une des deux catégories de réponse cible. En déterminant le taux de réponse vraie (originale) de la variable cible, le diagramme de lift construit tient compte du suréchantillonnage d’un niveau de la cible. En cas d'absence de suréchantillonnage, la valeur de cette option doit correspondre au taux de réponse de la base de données utilisée pour développer le modèle.
Cette option permet de créer un diagramme de lift cohérent selon le contexte de décision, ainsi que de vérifier les erreurs afin de garantir la pertinence du diagramme créé.
Cette option permet de placer une étiquette sur le diagramme créé afin d’indiquer l’échantillon du flux de données qui a servi à créer le diagramme, ou de fournir d’autres informations que l’artisan de données considère comme pertinentes pour le diagramme.
Pour terminer, définissez le nombre d'enregistrements à lire simultanément pour limiter le nombre d'enregistrements extraits du flux de données à la fois.
Onglet Options graphiques
Taille du tracé: configurez la taille du tracé en pouces ou en centimètres.
Résolution du graphique : sélectionnez la résolution du graphique en points par pouce : 1x (96 dpi) ; 2x (192 dpi) ou 3x (288 dpi).
Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur.
Une résolution élevée produit un fichier de plus grande taille avec une qualité d'impression supérieure.
Taille de la police de base (points): permet de configurer la taille de la police.
Visualisation de la sortie
Champ de rapport Alteryx constitué d’un objet R-Graph et d’une table Lift/Gains. Ces éléments peuvent servir à aider à créer des rapports personnalisés.