Herramienta de tabla de contingencia
La herramienta de la tabla de contingencia tiene un uso similar al de la Herramienta de tabla de frecuencias, pero en vez de sólo mirar cada campo individualmente, la herramienta de tabla de contingencia busca hasta cuatro variables/campos y cómo se relacionan entre sí. La herramienta produce dos salidas, una salida de datos que enumera todas las combinaciones de valores entre los campos seleccionados, con una frecuencia y una columna de porcentaje. La salida de informe produce tablas para mostrar las combinaciones de valores entre los campos y también incluye algunos porcentajes de fila y columna adicionales.
Si el usuario sólo está analizando dos campos, también puede seleccionar la salida de la estadística Chi-Square que se incluirá con el informe. Se utiliza una estadística de chi cuadrado para investigar si las distribuciones de variables categóricas difieren entre sí. R debe instalarse para que esta opción se ejecute correctamente.
Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión Portal de licencias y descargas de Alteryx para instalar R y los paquetes utilizados por la Herramienta R. Consulta Descargar y usar herramientas predictivas.
Configurar la herramienta
- Incluya la estadística Chi-cuadrada: una estadística del cuadrado de Chi (X2) se utiliza para investigar si las distribuciones de variables categóricas diferencian de una otra. Estos datos se incluirán en la salida del informe.
- No incluya la estadística Chi-cuadrada: se pueden seleccionar al menos dos campos y hasta cuatro campos.
Seleccione los dos campos que desea analizar.
Cuando se seleccionan campos para cualquiera de las opciones, se aplican las siguientes reglas:
- Cada variable debe tener valores únicos. Si los valores no son exclusivos en los campos, se iniciará un error.
- No se pueden seleccionar determinados tipos de campos: FixedDecimal, Float, Double, Date, Time, DateTime, BLOB y SpatialObj. Se permiten tipos de campos enteros, pero sólo se deben utilizar si el campo es verdaderamente categórico.
Ver la salida
D ancla: la salida de datos incluye los campos siguientes:
Nombre | Descripción |
---|---|
InputField_SelectedField1 (2, 3, 4) | Nombre de campo original de los datos de entrada.
Dependiendo del número de campos seleccionados, InputField_SelectedField3 y InputField_SelectedField4 pueden no estar presentes y la parte en cursiva se actualizará con el nombre de campo seleccionado real. |
Frecuencia | Número de veces que el valor está presente en los datos de entrada para el nombre de campo dado. |
Porcentaje | (expedientes de la frecuencia/del total) * 100 |
R ancla: la salida del informe incluye una tabla de contingencia para cada campo seleccionado.
El primer registro de esta salida mostrará cualquier advertencia para los tipos de campo, si alguno de los campos seleccionados se establece en tipos de datos numéricos de los que se muestra un aviso. El resto del informe muestra una tabla de contingencia para cada combinación de valores de campo, el encabezado de la tabla muestra los campos seleccionados por el usuario y los valores de los campos que no se muestran en la tabla. La tabla también muestra una columna total y filas para la frecuencia, porcentaje, porcentaje de fila y porcentaje de columna.
Si se selecciona la opción de estadística Chi-Square, debajo de la tabla se muestran los siguientes valores; Chi-cuadrado, DF, y valor p. Chi-cuadrado es el valor calculado del Chi-cuadrado, DF es grados de libertad y p-el valor es el valor de la estadística devuelto de R, el más bajo el p-valor más probable es que las variables son dependientes el uno al otro.
I Anchor: la salida interactiva incluye un gráfico donde el espectador puede personalizar lo que muestra con una serie de opciones desplegables.