Investigación de datos

La categoría de herramienta de investigación de datos incluye herramientas para comprender los datos que se utilizarán en un proyecto de análisis predictivo y herramientas para realizar tareas de muestreo de datos especializadas para el análisis predictivo.

Herramienta de análisis de asociación: La herramienta de análisis de asociación determina qué campos de una base de datos tienen una asociación bivariante entre sí.

Herramienta Perfil básico de datos: La herramienta básica de Perfil de datos produce metadatos básicos como tipo de datos, mín, máx, promedio, número de valores perdidos, etc.

Herramienta de tabla de contingencia: La herramienta tabla de contingencias crea una tabla de contingencia basada en campos seleccionados, para enumerar todas las combinaciones de los valores de campo con columnas de frecuencia y porcentaje.

Herramienta de análisis de distribución: La herramienta de análisis de distribución se ajusta a una o más distribuciones a los datos de entrada y las compara basándose en una serie de estadísticas de bondad de ajuste *.

Herramienta Resumen de campos: La herramienta Resumen de campos analiza los datos y crea un informe de resumen que contiene estadísticas descriptivas de datos en columnas seleccionadas. Utilice la herramienta Resumen de campos para obtener información sobre los datos y recibir recomendaciones para administrar los datos.

Herramienta de tabla de frecuencias: La herramienta tabla de frecuencias produce un análisis de frecuencias para los campos seleccionados. La salida incluye un resumen de los campos seleccionados con conteos de frecuencias y porcentajes para cada valor en un campo.

Herramienta de trama de calor: La herramienta diagrama de calor utiliza un mapa de color de diagrama de calor para mostrar la distribución conjunta de dos variables que son variables numéricas continuas o categorías ordenadas.

Herramienta Histograma: La herramienta histograma proporciona un diagrama de histograma para un campo numérico mostrando las frecuencias de los registros que caen en un conjunto de intervalos de valores continuos. También proporciona una parcela de densidad empírica suavizada. Las frecuencias se muestran cuando no se selecciona ningún gráfico de densidad, y las probabilidades cuando se selecciona esta opción.

Herramienta de pesos de importancia: La herramienta pesos de importancia proporciona métodos para seleccionar un conjunto de variables que se usarán en un modelo predictivo basado en la forma en que se relaciona fuertemente cada predictor posible con la variable de destino.

Herramienta de correlación de Pearson: La herramienta de correlación de Pearson mide la dependencia lineal entre dos variables, así como la covarianza.

Herramienta de trama de medios: La herramienta trama de medios toma un campo categórico numérico o binario (con el campo binario categórico convertido en un conjunto de cero y uno valores) como un campo de respuesta junto con un campo categórico y traza la media del campo de respuesta para cada una de las categorías (nivel s) del campo categórico.

Herramienta diagrama: La herramienta diagrama hace scatterplots mejorada, con opciones para incluir boxplots en los márgenes, una línea de regresión lineal, una curva Lisa a través de regresión no paramétrica, una propagación condicional suavizada, identificación de valores atípicos y una línea de regresión.

Herramienta Correlación de Spearman: La herramienta de correlación de Spearman evalúa qué tan bien una función monotónica arbitraria puede describir la relación entre dos variables, sin hacer ninguna otra hipótesis acerca de la naturaleza particular de la relación entre las variables.

Herramienta de la trama del violín: La herramienta de trazado de violines muestra la distribución de una única variable numérica, y transmite la densidad de la distribución.