
Ferramenta Tabela De Contingência
Use a ferramenta Tabela de Contingência para analisar até quatro variáveis/campos e determinar como elas se relacionam entre si. A ferramenta Tabela de Contingência tem um uso semelhante ao da ferramenta Tabelade Frequência . A ferramenta produz duas saídas, uma saída de dados que lista todas as combinações de valores entre os campos selecionados, com frequência e uma coluna por cento. A saída do relatório produz tabelas para mostrar as combinações de valores entre os campos e também inclui algumas porcentagens de linha e coluna adicionais.
Se você estiver apenas analisando dois campos, você também pode selecionar para produzir a estatística qui-quadrado para ser incluído no relatório. Uma estatística qui-quadrado é usada para investigar se as distribuições de variáveis categóricas diferem umas das outras.
R deve ser instalado para que esta opção seja executada com êxito. Vá para Opções > Baixe ferramentas preditivas e faça login no portal Alteryx Downloads and Licenses para instalar R e os pacotes usados pela ferramenta R. Consulte Baixar e Usar Ferramentas Preditivas.
Configurar a ferramenta
- Inclua a estatística qui-quadrado: Uma estatística qui-quadrado (X2) é usada para investigar se as distribuições de variáveis categóricas diferem umas das outras. Esses dados serão incluídos na saída do relatório. Selecione os dois campos a serem analisados via Variável 1 e Variável 2.
- Não inclua a estatística qui-quadrado: Pelo menos dois campos e até quatro campos podem ser selecionados. Quando você seleciona campos para qualquer opção, essas regras se aplicam:
- Cada variável deve ter valores exclusivos. Se os valores não forem exclusivos entre os campos, um erro será Descartado.
- Certos tipos de campo não podem ser selecionados: FixedDecimal, Float, Double, Date, Time, DateTime, Blob e SpatialObj. Tipos de campo inteiro são permitidos, mas só devem ser usados se o campo for verdadeiramente categórico.
Ver a saída
- Âncora D: A saída de dados inclui os seguintes campos:
Nome Descrição InputField_SelectedField1 (2, 3, 4) Nome de campo original dos dados de entrada.
Dependendo de quantos campos forem selecionados InputField_SelectedField3 e InputField_SelectedField4 podem não estar presentes e a parte em itálico é atualizada com o nome de campo selecionado real.Freqüência Contagem de vezes que o valor está presente nos dados de entrada para o nome de campo determinado. Por cento (freqüência/total de registros) * 100
- Âncora R: A saída do relatório inclui uma tabela de contingência para cada campo selecionado.
O primeiro registro nesta saída mostra quaisquer avisos para tipos de campo. Se algum dos campos selecionados for definido para tipos de dados numéricos, um aviso será mostrado. O restante do relatório mostra uma tabela de contingência para cada combinação de valores de campo, o cabeçalho da tabela mostra os campos que foram selecionados pelo usuário e os valores para quaisquer campos que não são mostrados na tabela. A tabela também mostra uma coluna total e linhas para frequência, Porcentagem, Porcentagem de Linhae Porcentagem de Coluna.
Se a opção de estatística qui-quadrado for selecionada, em seguida, sob a tabela, esses valores ão exibidos:- Chi-quadrado: O valor calculado qui-quadrado.
- df: Graus de liberdade.
- p-valor. O valor estatístico devolvido de R.Quanto menor o valor p, maior a probabilidade é que as variáveis sejam dependentes umas das outras.
- Ancorar: A saída interativa inclui um gráfico onde o espectador pode personalizar o que exibe com uma série de opções de dropdown.