Herramienta de análisis de asociación

La herramienta de análisis de asociación permite a un usuario determinar qué campos de una base de datos tienen una asociación bivariante entre sí. La evaluación puede basarse en los coeficientes de correlación del producto-momento de Pearson ("regular"), * coeficientes de correlación de orden de Spearman, * * o las estadísticas D de Hoeffding * * * (una prueba no paramétrica que puede encontrar relaciones no monotónicas como U-Shapes invertidos). Además, se determina la significación estadística de cada medida de asociación.

La herramienta siempre proporciona el conjunto completo de relaciones, y opcionalmente puede proporcionar un análisis en profundidad de un campo de interés de destino y su relación con otras variables numéricas. El campo de interés de destino puede ser una variable numérica o una variable categórica binaria. Si se utiliza una variable categórica binaria como campo de destino, se convierte en un campo numérico cero-uno con el valor uno implantado en los casos en que el campo tiene un nivel que corresponde a un nivel de destino, y un valor cero se imputa de otra manera.

Esta herramienta utiliza la herramienta R. Ve a Opciones > Descargar herramientas predictivas e inicia sesión Portal de licencias y descargas de Alteryx para instalar R y los paquetes utilizados por la Herramienta R. Consulta Descargar y usar herramientas predictivas.

Configurar la herramienta

  1. Apunte a un campo para un análisis más detallado: Esto le permite ejecutar un análisis más focalizado de un campo de interés y otros campos de los datos. Esto es particularmente útil si el objetivo del análisis es determinar el conjunto de campos que se usarán en un modelo predictivo subsiguiente. Si esta opción está seleccionada, debe proporcionar el nombre del campo de destino, que puede ser tanto numérico como binario categórico. Si el campo es binario categórico, seleccione el valor de este campo que será re codificado como uno, con el otro valor codificado como cero. Si el campo proporcionado es categórico y contiene más de dos valores diferentes, se devolverá un error.
  2. Las columnas que contienen identificadores únicos, como claves primarias sustitutas y claves primarias naturales, no deben utilizarse en análisis estadísticos. No tienen ningún valor predictivo y pueden causar excepciones en tiempo de ejecución.

  3. Campos (Seleccione dos o más): seleccione los campos para el análisis de asociación. Si se ha seleccionado un campo "target", se incluirá automáticamente en esta lista. Los campos que no son de destino deben ser numéricos.
  4. Medida de asociación: Seleccione una de las correlaciones entre el producto y el momento de Pearson, la correlación de la orden de Spearmano la estadística D de Hoeffding.

Ver la salida

R Anchor: la salida del informe incluye 3 tablas que componen un análisis de correlación de Pearson: análisis focalizado del trans de campo, matriz de correlación completa y matriz de valores p correspondientes.

I Anchor: el informe interactivo incluye una matriz de correlación con diagrama que cambia basándose en la posición del ratón.

Tabla de valores críticos para r de Pearson