Outil Nuage de points

L’outil Nuage de points génère des nuages de points avancés, avec la possibilité d’inclure des diagrammes en boîte dans les marges, une ligne de régression linéaire, une courbe lisse via une régression non paramétrique, une diffusion conditionnelle lissée, une identification des valeurs aberrantes et une ligne de régression. La courbe lisse peut aider un utilisateur à voir plus facilement la nature de la relation entre deux variables relatives à un nuage de points traditionnel, particulièrement dans des cas où on rencontre de nombreuses observations ou un haut niveau de dispersion dans les données.

Cet outil utilise l’outil R. Allez dans Options > Télécharger les outils prédictifs et connectez-vous à la Portail Téléchargements et licences Alteryx pour installer l’outil R et les packages utilisés par ce dernier. Reportez-vous à la page Outil R. Voir Télécharger et utiliser les outils prédictifs.

Configurer l’outil

Utilisez l' onglet Configuration pour définir les contrôles obligatoires pour le dispersion.

  • Champ X (horizontal): champ à utiliser sur l'axe horizontal de l'intrigue. Le choix se limite aux champs numériques.
  • Y (vertical) champ: champ à utiliser sur l'axe horizontal de l'intrigue. Un champ numérique ou un champ catégoriel binaire. Si un champ catégoriel binaire est sélectionné, un nouveau champ (qui portera le suffixe « .num » apposé au nom du champ d’origine) sera créé avec des valeurs numériques de zéro ou un. Si une variable catégorielle avec plus de deux valeurs est sélectionnée, le nœud renverra une erreur.
  • Le champ y est une variable binaire catégorique: une case à cocher pour indiquer que le champ y est une variable binaire catégorique. Lorsque cette option est activée, l’utilisateur doit indiquer la valeur de champ correspondant à une valeur de un (la « cible »), les entrées liées à l’autre valeur de champ prenant la valeur zéro.

Utilisez l' onglet éléments de traçage pour définir les règles de traçage des données.

  • Ligne des moindres carrés (régression): affiche une ligne de régression linéaire simple entre les champs X et Y. Élément inclus par défaut.
  • Ligne lisse: affiche une ligne non linéaire entre les champs X et Y créés à l'aide d'un modèle loess (régression locale non paramétrique). Élément inclus par défaut.
  • Span pour Smooth: paramètre qui contrôle la taille de la zone locale utilisée pour construire les estimations de loess. Plus le nombre est petit, plus la zone utilisée est petite.
  • Afficher la propagation: deux courbes montrant les résultats des modèles de loess à la fois les résiduels de la racine moyenne quadratique positive et négative de la ligne de loess d'origine pour afficher la propagation conditionnelle et l'asymétrie dans les erreurs. Élément inclus par défaut.
  • Marginal diagrammes: inclut une diagrammes univariée du champ X et Y le long de chaque accès respectif. Ceci est utile lorsqu’il s’agit d’évaluer la distribution des valeurs pour les deux champs. Ils sont inclus par défaut.
  • Gigue x: si elle est sélectionnée, les valeurs x sont aléatoirement perturbées par une petite quantité. Ceci est utile si un plus grand nombre d’enregistrements dans le champ X porte sur une valeur ou sur un petit nombre de valeurs. Cet élément n’influence que les points d’aspect sur les graphiques, pas les lignes de régression et de Loess ajustées.
  • Gigue y: si elle est sélectionnée, les valeurs y sont perturbées aléatoirement par une petite quantité. Ceci est utile si un grand nombre d’enregistrements dans le champ Y porte sur une valeur ou sur un petit nombre de valeurs. Cet élément n’influence que les points d’aspect sur les graphiques, pas les lignes de régression et de Loess ajustées.
  • Axe de log x: s'il est sélectionné, une transformation de journal naturel est appliquée aux valeurs X. Cela est souvent utile pour explorer certains types de relations non linéaires.
  • Axe y log: s'il est sélectionné, une transformation de journal naturel est appliquée aux valeurs y. Cela est souvent utile pour explorer certains types de relations non linéaires.
  • Parcelle par groupe: cette option permet d'examiner l'effet d'un champ catégorique sur la relation entre les champs x et y, avec chaque valeur du catégorique résultant en un groupe de valeurs x et y. Les groupes sont tracés avec des couleurs et des caractères de traçage différents. Si cette option est sélectionnée, l’utilisateur est invité à donner un champ catégoriel à utiliser pour la création des groupes, (facultatif) à spécifier s’il souhaite tracer des courbes de régression et des courbes de Loess pour chaque groupe, et à déterminer l’emplacement de la légende qui identifie les différents groupes.

Utilisez l' onglet options de style pour définir les contrôles de graphe, tels que les étiquettes et l'échelle.

  • Étiquette de l'axe x (facultatif): étiquette facultative pour l'axe x (horizontal). Par défaut, le nom du champ X est utilisé.
  • Étiquette de l'axe y (facultatif): étiquette facultative pour l'axe y (vertical). Par défaut, le nom du champ Y est utilisé.
  • Échelle de taille de point: contrôle la taille des points dans l'affichage, avec des valeurs plus grandes entraînant une taille de point plus grande.
  • Echelle de taille du texte de l'axe: contrôle la taille des nombres et des graduations le long de chaque axe, avec des valeurs plus grandes résultant en un texte plus grand.
  • Étiquettes de l'axe taille du texte Echelle: contrôle la taille de l'étiquette de l'axe le long de chaque axe, avec des valeurs plus grandes entraînant un texte plus grand.
  • Titre principal échelle de taille du texte: contrôle la taille du texte du titre principal, avec des valeurs plus grandes résultant en un texte plus grand.

Utilisez l' onglet options graphiques pour définir les commandes de la sortie graphique.

  • Tailledu tracé: sélectionnez pouces ou centimètres pour la taille du graphique.
  • Résolution du graphique : sélectionnez la résolution du graphique en points par pouce : 1x (96 ppp) ; 2x (192 PPP) ; ou 3x (288 PPP). Une résolution basse produit un fichier de plus petite taille et facilite la visualisation sur un moniteur. Une résolution élevée produit un fichier de plus grande taille avec une qualité d’impression supérieure.

  • Taille de police de base (points): sélectionnez la taille de la police dans le graphique.

Afficher la sortie

Objet R-Graph Alteryx pouvant servir à aider à créer des rapports personnalisés.