Ferramenta dispersão

A ferramenta dispersão torna a scatterplots aprimorada, com opções para incluir boxplots nas margens, uma linha de regressão linear, uma curva suave através de regressão não-paramétrica, uma propagação condicional suavizada, identificação de atípica e uma linha de regressão. A curva suave pode ajudar um usuário mais facilmente ver a natureza da relação entre duas variáveis em relação a um enredo tradicional de dispersão, especialmente nos casos em que há muitas observações ou um alto nível de dispersão nos dados.

Esta ferramenta utiliza a ferramenta R. Acesse Opções > Baixar ferramentas preditivas e faça login em Portal de downloads and licenças do Alteryx para instalar o R e os pacotes usados pela Ferramenta R. Veja Baixar e utilizar ferramentas preditivas.

Configure a ferramenta

Use a guia configuração para definir os controles obrigatórios para o dispersão.

  • Campo X (horizontal): o campo a ser usado no eixo horizontal da plotagem. A escolha é limitada a campos numéricos.
  • Campo Y (vertical): o campo a ser usado no eixo horizontal da plotagem. Um campo numérico ou um campo binário categórico pode ser usado. Se um campo categórico binário for selecionado, um novo campo (que terá o sufixo ". num" anexado ao nome do campo original) será criado com valores numéricos de zero ou um. Se a variável categórica com mais de dois valores for selecionada, o nó retornará um erro.
  • O campo y é uma variável categórica binária: uma caixa de seleção para indicar que o campo y é uma variável categórica binária. Quando verificado, o usuário é solicitado a indicar o valor do campo que corresponderá a um valor de um (o "destino"), com entradas com o outro valor de campo, tendo o valor zero.

Use a guia plotar elementos para definir as regras de como os dados são plotados.

  • Linha de mínimo-quadrados (regressão): exibe uma linha de regressão linear simples entre os campos X e Y. Incluído por padrão.
  • Linha suave: exibe uma linha não-linear entre os campos X e Y que é criado usando um modelo de loess (regressão local não paramétrica). Incluído por padrão
  • Span para Smooth: um parâmetro que controla o tamanho da área local usada para construir as estimativas loess. Quanto menor o número, menor a área utilizada.
  • Show spread: duas curvas mostrando os resultados dos modelos loess para os resíduos positivos e negativos de raiz-média-quadrada da linha loess original para exibir propagação condicional e assimetria nos erros. Incluído por padrão.
  • Marginal boxplots: inclui univariada boxplots do campo X e Y ao longo de cada respectivo acesso. Isso é útil na avaliação da distribuição de valores para ambos os campos, e eles são incluídos por padrão.
  • Jitter x: se selecionada, os valores de x são aleatoriamente perturbados por uma pequena quantidade. Isso é útil se um número maior de registro no campo X assumir um ou um pequeno número de valores. Ele só influencia os pontos de aparência nos gráficos, não a regressão cabida e linhas loess.
  • Jitter y: se selecionada, os valores de y são aleatoriamente perturbados por uma pequena quantidade. Isso é útil se um número maior de registro no campo Y assumir um ou um pequeno número de valores. Ele só influencia os pontos de aparência nos gráficos, não a regressão cabida e linhas loess.
  • Log eixo x: se selecionada, uma transformação de log natural é aplicada aos valores de x. Fazer isso é muitas vezes útil para explorar certos tipos de relações não-lineares.
  • Eixo y de log: se selecionada, uma transformação de log natural é aplicada aos valores y. Fazer isso é muitas vezes útil para explorar certos tipos de relações não-lineares.
  • Plot por grupos: esta opção permite um exame do efeito de um campo categórico sobre a relação entre os campos x e y, com cada valor do categórico, resultando em um grupo de valores x e y. Grupos são plotados com cores diferentes e caracteres de plotagem. Se essa opção for selecionada, o usuário será solicitado a fornecer o campo categórico para ser usado na criação de grupos, (opcionalmente) se eles gostariam de regressão e curvas loess plotadas para cada grupo e a localização da legenda que identifica os diferentes grupos.

Use a guia opções de estilo para definir os controles de gráfico, como rótulos e escala.

  • Rótulo do eixo x (opcional): uma etiqueta opcional para o eixo x (horizontal). Por padrão, o nome do nome do campo X é usado.
  • Rótulo de eixo y (opcional): um rótulo opcional para o eixo y (vertical). Por padrão, o nome do nome do campo Y é usado.
  • Escala de tamanho de ponto: controla o tamanho dos pontos dentro do display, com valores maiores, resultando em um tamanho de ponto maior.
  • Escala do tamanho do texto do eixo: controla o tamanho dos números e marcas de escala ao longo de cada eixo, com valores maiores resultando em texto maior.
  • Escala do tamanho do texto rótulos do eixo: controla o tamanho do rótulo do eixo ao longo de cada eixo, com valores maiores resultando em texto maior.
  • Escala de tamanho do texto do título principal: controla o tamanho do texto do título principal, com valores maiores resultando em texto maior.

Use a guia opções de gráficos para definir os controles da saída gráfica.

  • Tamanhodo lote: selecione polegadas ou centímetros para o tamanho do gráfico.
  • Resolução do gráfico: selecione a resolução do gráfico em pontos por polegada: 1x (96 dpi); 2x (192 dpi); ou 3x (288 dpi). A resolução mais baixa cria um arquivo menor e é melhor para visualização em um monitor. Maior resolução cria um arquivo maior com melhor qualidade de impressão.

  • Tamanho da fonte base (pontos): selecione o tamanho da fonte no gráfico.

Visualizar a saída

Um objeto Alteryx R-Graph que pode ser usado para ajudar na criação de relatórios personalizados.