Ferramenta de tabela de contingência

A ferramenta de tabela de contingência tem um uso semelhante ao da Ferramenta de tabela de freqüência, mas em vez de apenas olhar para cada campo individualmente, a ferramenta de tabela de contingência Olha para até quatro variáveis/campos e como eles se relacionam entre si. A ferramenta produz duas saídas, uma saída de dados que lista todas as combinações de valores entre os campos selecionados, com uma freqüência e uma coluna por cento. A saída do relatório produz tabelas para mostrar as combinações de valores entre os campos e também inclui algumas porcentagens de linha e coluna adicionais.

Se o usuário está apenas analisando dois campos, eles também podem selecionar a saída da estatística Chi-Square para ser incluído com o relatório. É usada uma estatística de Chi Square para investigar se as distribuições de variáveis categóricas diferem uma da outra. R deve ser instalado para que esta opção seja executada com êxito.

Esta ferramenta utiliza a ferramenta R. Acesse Opções > Baixar ferramentas preditivas e faça login em Portal de downloads and licenças do Alteryx para instalar o R e os pacotes usados pela Ferramenta R. Veja Baixar e utilizar ferramentas preditivas.

Configure a ferramenta

  • Inclua a estatística Chi-squared: uma estatística do quadrado de Chi (X2) é usada para investigar se as distribuições de variáveis categóricas diferem de uma outra. Esses dados serão incluídos na saída do relatório.
  • Selecione os dois campos a serem analisados.

  • Não inclua a estatística Chi-squared: pelo menos dois campos e até quatro campos podem ser selecionados.

Ao selecionar campos para qualquer opção, as seguintes regras se aplicam:

  • Cada variável deve ter valores exclusivos. Se os valores não forem exclusivos entre os campos, um erro será Descartado.
  • Determinados tipos de campo não podem ser selecionados: FixedDecimal, float, duplo, Date, time, DateTime, BLOB e SpatialObj. Tipos de campo inteiro são permitidos, mas só devem ser usados se o campo for verdadeiramente categórico.

Visualizar a saída

D âncora: a saída de dados inclui os seguintes campos:

Nome Descrição
InputField_SelectedField1 (2, 3, 4) Nome de campo original dos dados de entrada.

Dependendo de quantos campos estão selecionados InputField_SelectedField3 e InputField_SelectedField4 podem não estar presentes e a parte em itálico será atualizada com o nome de campo selecionado real.

Frequência Contagem de vezes que o valor está presente nos dados de entrada para o nome de campo determinado.
Por cento (freqüência/total de registros) * 100

R Anchor: a saída do relatório inclui uma tabela de contingência para cada campo selecionado.

O primeiro registro nessa saída mostrará quaisquer avisos para tipos de campo, se qualquer um dos campos selecionados estiver definido como tipos de dados numéricos do que um aviso é mostrado. O restante do relatório mostra uma tabela de contingência para cada combinação de valores de campo, o cabeçalho da tabela mostra os campos que foram selecionados pelo usuário e os valores para quaisquer campos que não são mostrados na tabela. A tabela também mostra uma coluna total e linhas para freqüência, porcentagem, porcentagem de linha e porcentagem de coluna.

Se a opção de estatística Chi-Square for selecionada, em seguida, abaixo da tabela, serão exibidos os seguintes valores; Chi-squared, DF e p-valor. Chi-squared é o valor calculado qui-quadrado, DF é graus de liberdade e p-valor é o valor estatístico retornado de R, menor o p-valor o mais provável é que as variáveis são dependentes uns dos outros.

Eu Anchor: a saída interativa inclui um gráfico onde o Visualizador pode personalizar o que exibe com uma série de opções drop-down.