Ferramenta de análise de associação

A ferramenta de análise de associação permite que um usuário determine quais campos em um banco de dados têm uma associação bivariada entre si. A avaliação pode basear-se nos coeficientes de correlação do momento do produto ("regular"), * os coeficientes de correlação de ordem de Spearman, * * ou as estatísticas D do Hoeffding * * * (um teste não-paramétrico que pode encontrar relações não monotônicas, como formas invertidas em U). Além disso, determina-se a importância estatística de cada medida de associação.

A ferramenta sempre fornece o conjunto completo de relacionamentos e, opcionalmente, pode fornecer uma análise aprofundada de um campo de interesse alvo e sua relação com outras variáveis numéricas. O campo de destino de interesse pode ser uma variável numérica ou uma variável categórica binária. Se uma variável categórica binária é usada como o campo de destino, em seguida, ele é convertido em um campo numérico zero-um com o valor um implantado em casos onde o campo tem um nível que corresponde a um nível de destino e um valor zero é implantado caso contrário.

Esta ferramenta utiliza a ferramenta R. Acesse Opções > Baixar ferramentas preditivas e faça login em Portal de downloads and licenças do Alteryx para instalar o R e os pacotes usados pela Ferramenta R. Veja Baixar e utilizar ferramentas preditivas.

Configure a ferramenta

  1. Segmentar um campo para uma análise mais detalhada: isso permite que você execute uma análise mais focada de um campo de interesse e outros campos nos dados. Isso é particularmente útil se o objetivo da análise for determinar o conjunto de campos a serem usados em um modelo preditivo subsequente. Se essa opção for selecionada, você deverá fornecer o nome do campo de destino, que pode ser categórico numérico ou binário. Se o campo for binário categórico, selecione o valor deste campo que será re codificado como um, com o outro valor codificado como zero. Se o campo fornecido for categórico e contiver mais de dois valores diferentes, um erro será retornado.
  2. As colunas que contêm identificadores exclusivos, como chaves primárias substitutas e chaves primárias naturais, não devem ser usadas em análises estatísticas. Elas não têm nenhum valor preditivo e podem causar exceções de tempo de execução.

  3. Campos (selecione dois ou mais): selecione os campos para a análise de associação. Se um campo "target" tiver sido seleccionado, será automaticamente incluído nesta lista. Os campos não-alvo devem ser numéricos.
  4. Medida de associação: selecione uma correlação de momento do produto Pearson, correlação de ordem de Spearman, ou estatística D Hoeffding.

Visualizar a saída

R Anchor: a saída do relatório inclui 3 tabelas que compõem uma análise de correlação de Pearson: análise focalizada de campo trans, matriz de correlação completa e matriz de valores p correspondentes.

I Anchor: o relatório interativo inclui uma matriz de correlação com dispersão que muda com base na posição do mouse.

Tabela de valores críticos para o r de Pearson