
Ferramenta Análise De Associação
A ferramenta de análise de associação permite que um usuário determine quais campos em um banco de dados têm uma associação bivariada entre si. A avaliação pode basear-se nos coeficientes de correlação do momento do produto ("regular"), * os coeficientes de correlação de ordem de Spearman, * * ou as estatísticas D do Hoeffding * * * (um teste não-paramétrico que pode encontrar relações não monotônicas, como formas invertidas em U). Além disso, determina-se a importância estatística de cada medida de associação.
A ferramenta sempre fornece o conjunto completo de relacionamentos e, opcionalmente, pode fornecer uma análise aprofundada de um campo de interesse alvo e sua relação com outras variáveis numéricas. O campo de destino de interesse pode ser uma variável numérica ou uma variável categórica binária. Se uma variável categórica binária é usada como o campo de destino, em seguida, ele é convertido em um campo numérico zero-um com o valor um implantado em casos onde o campo tem um nível que corresponde a um nível de destino e um valor zero é implantado caso contrário.
Esta ferramenta utiliza a ferramenta R. Vá para Opções > Baixar ferramentas preditivas e faça login no portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela Ferramenta R. Consulte Baixar e utilizar ferramentas preditivas.
Configuração de ferramentas
- Segmente um campo para uma análise mais detalhada: Isso permite que você execute uma análise mais focada de um campo de interesse e outros campos nos dados. Isso é particularmente útil se o objetivo da análise for determinar o conjunto de campos a serem usados em um modelo preditivo subsequente. Se essa opção for selecionada, você deverá fornecer o nome do campo de destino, que pode ser categórico numérico ou binário. Se o campo for binário categórico, selecione o valor deste campo que será re codificado como um, com o outro valor codificado como zero. Se o campo fornecido for categórico e contiver mais de dois valores diferentes, um erro será retornado.
As colunas que contêm identificadores exclusivos, como chaves primárias alternativas e chaves primárias naturais, não devem ser usadas em análises estatísticas. Elas não têm nenhum valor preditivo e podem causar exceções de tempo de execução. - Campos (selecione dois ou mais): Selecione os campos para a análise de associação. Se um campo "target" tiver sido seleccionado, será automaticamente incluído nesta lista. Os campos não-alvo devem ser numéricos.
- Medida de associação: Selecione uma correlação entre o produto e o momento de Pearson, a correlação de ordem de Spearmanou a estatística D de hoeffding.
Ver a saída
R Anchor: a saída do relatório inclui 3 tabelas que compõem uma análise de correlação de Pearson: análise focalizada de campo trans, matriz de correlação completa e matriz de valores p correspondentes.
I Anchor: o relatório interativo inclui uma matriz de correlação com dispersão que muda com base na posição do mouse.