Ferramenta de tabela de contingência
A ferramenta de tabela de contingência tem um uso semelhante ao da Ferramenta de tabela de freqüência, mas em vez de apenas olhar para cada campo individualmente, a ferramenta de tabela de contingência Olha para até quatro variáveis/campos e como eles se relacionam entre si. A ferramenta produz duas saídas, uma saída de dados que lista todas as combinações de valores entre os campos selecionados, com uma freqüência e uma coluna por cento. A saída do relatório produz tabelas para mostrar as combinações de valores entre os campos e também inclui algumas porcentagens de linha e coluna adicionais.
Se o usuário está apenas analisando dois campos, eles também podem selecionar a saída da estatística Chi-Square para ser incluído com o relatório. É usada uma estatística de Chi Square para investigar se as distribuições de variáveis categóricas diferem uma da outra. R deve ser instalado para que esta opção seja executada com êxito.
Esta ferramenta utiliza a ferramenta R. Acesse Opções > Baixar ferramentas preditivas e faça login em Portal de downloads and licenças do Alteryx para instalar o R e os pacotes usados pela Ferramenta R. Veja Baixar e utilizar ferramentas preditivas.
Configure a ferramenta
- Inclua a estatística Chi-squared: uma estatística do quadrado de Chi (X2) é usada para investigar se as distribuições de variáveis categóricas diferem de uma outra. Esses dados serão incluídos na saída do relatório.
- Não inclua a estatística Chi-squared: pelo menos dois campos e até quatro campos podem ser selecionados.
Selecione os dois campos a serem analisados.
Ao selecionar campos para qualquer opção, as seguintes regras se aplicam:
- Cada variável deve ter valores exclusivos. Se os valores não forem exclusivos entre os campos, um erro será Descartado.
- Determinados tipos de campo não podem ser selecionados: FixedDecimal, float, duplo, Date, time, DateTime, BLOB e SpatialObj. Tipos de campo inteiro são permitidos, mas só devem ser usados se o campo for verdadeiramente categórico.
Visualizar a saída
D âncora: a saída de dados inclui os seguintes campos:
Nome | Descrição |
---|---|
InputField_SelectedField1 (2, 3, 4) | Nome de campo original dos dados de entrada.
Dependendo de quantos campos estão selecionados InputField_SelectedField3 e InputField_SelectedField4 podem não estar presentes e a parte em itálico será atualizada com o nome de campo selecionado real. |
Frequência | Contagem de vezes que o valor está presente nos dados de entrada para o nome de campo determinado. |
Por cento | (freqüência/total de registros) * 100 |
R Anchor: a saída do relatório inclui uma tabela de contingência para cada campo selecionado.
O primeiro registro nessa saída mostrará quaisquer avisos para tipos de campo, se qualquer um dos campos selecionados estiver definido como tipos de dados numéricos do que um aviso é mostrado. O restante do relatório mostra uma tabela de contingência para cada combinação de valores de campo, o cabeçalho da tabela mostra os campos que foram selecionados pelo usuário e os valores para quaisquer campos que não são mostrados na tabela. A tabela também mostra uma coluna total e linhas para freqüência, porcentagem, porcentagem de linha e porcentagem de coluna.
Se a opção de estatística Chi-Square for selecionada, em seguida, abaixo da tabela, serão exibidos os seguintes valores; Chi-squared, DF e p-valor. Chi-squared é o valor calculado qui-quadrado, DF é graus de liberdade e p-valor é o valor estatístico retornado de R, menor o p-valor o mais provável é que as variáveis são dependentes uns dos outros.
Eu Anchor: a saída interativa inclui um gráfico onde o Visualizador pode personalizar o que exibe com uma série de opções drop-down.