Herramienta Resumen de campos
La herramienta Resumen de campos analiza los datos y crea un informe de resumen que contiene estadísticas descriptivas de datos en columnas seleccionadas.
Utilice la herramienta Resumen de campos para obtener información sobre los datos y recibir recomendaciones para administrar los datos.
En esta herramienta se admiten numérica, cadena, espacio y fecha/hora. Para cada tipo de datos se proporciona un conjunto único de estadísticas descriptivas. Consulta Tipos de datos para más información sobre tipos de datos.
Configurar la herramienta
Seleccione todas, algunas o una muestra aleatoria de columnas que se incluirán en la salida.
Las columnas que contienen datos que no se admiten en esta herramienta, como los datos booleanos, se pueden seleccionar durante la configuración de la herramienta; sin embargo, la columna no se analiza ni se incluye en la salida de la herramienta.
- Seleccione los campos a información de resumen del producto: seleccione las columnas que desea analizar e incluir en la salida.
- Todos: haga clic para seleccionar todas las columnas de los datos.
- None: haga clic para anular la selección de columnas seleccionadas previamente.
- Datos de entrada de ejemplo: Seleccione esta opción para incluir una muestra de columnas en la salida en lugar de seleccionar todas o columnas específicas.
- Random N Records: seleccione el número de registros que se incluirán en la salida.
- Aleatorio N% de registros: seleccione el porcentaje de registros entrantes que se incluirán en la salida.
Ver la salida
La herramienta Resumen de campos tiene tres salidas:
- O Anchor: una secuencia de datos Alteryx con estadísticas descriptivas para columnas seleccionadas junto con recomendaciones, en la columna comentarios, para la gestión de datos.
- R Anchor: informe estático con diagrama y estadísticas descriptivas para columnas seleccionadas junto con recomendaciones (ver observaciones) para la administración de datos en una columna. Para ver el informe, añada una herramienta de búsqueda y conéctela a la salida R. Consulta Herramienta Examinar.
- I ancla: un tablero interactivo que consiste en los paneles extensibles para cada columna. Para ver el informe, añada una herramienta de búsqueda y conéctela a la salida I. Consulta Herramienta Examinar. Cada panel consta de un histograma o un gráfico de columnas y estadísticas resumidas:
- Sitúese sobre un panel para mostrar iconos adicionales.
- Haga clic en el icono de información para ver información adicional
- Haga clic en el icono expandir para abrir el informe en una vista detallada.
- Sitúese sobre una barra en la trama para mostrar los detalles.
- Seleccione variable para ver para enfocar en un conjunto más pequeño de columnas.
- Clasifique los paneles alfabéticamente o por porcentaje de valores perdidos.
- Sitúese sobre un panel para mostrar iconos adicionales.
Las estadísticas descriptivas disponibles en la salida dependen del tipo de datos de las columnas seleccionadas para el análisis. Los resultados se enumeran horizontalmente. Desplácese de izquierda a derecha para ver estadísticas para cada tipo de datos.
Si una columna contiene datos numéricos, se proporcionan las siguientes estadísticas:
- Min: el valor mínimo en los datos.
- Máx: el valor máximo en los datos.
- Mediana: valor medio en los datos.
- Std. Dev.: la medida de la dispersión de los valores se encuentran en los datos.
- porcentaje que falta: el% de los valores de los datos que son NULL.
- Valores únicos: el número de valores únicos en los datos.
- media: el promedio de los datos.
- Diseño: Añada una herramienta de búsqueda y conéctela a la salida R para ver las estadísticas en un formato visual. Consulta Herramienta Examinar.
- Observaciones: recomendaciones para la gestión de datos, si están disponibles.
Si una columna contiene datos de cadena, se proporcionan las siguientes estadísticas:
- porcentaje que falta: el% de los valores de los datos que son NULL.
- Valores únicos: el número de valores únicos en los datos.
- Valor más corto: valor de cadena corto (longitud) en los datos.
- Valor más largo: el valor de cadena más largo (longitud) de los datos.
- Conteode valor mínimo: número de valores que equivalen al valor minimo.
- Conteo de valor máx.: número de valores que equivalen al valor máximo.
- Observaciones: recomendaciones para la gestión de datos, si están disponibles.
Si una columna contiene datos espaciales, se proporcionan las siguientes estadísticas:
- porcentaje que falta: el% de los valores de los datos que son NULL.
- Tipode objeto: tipo de objeto espacial (por ejemplo, punto o polígono) en los datos.
- Área de AVG (millas cuadradas): el área media, en kilómetros cuadrados, de los valores de los datos.
- Longitud AVG (millas): longitud media, en millas, de los valores de los datos.
- Puntos AVG NUM: número medio de valores en los datos que son puntos.
- Observaciones: recomendaciones para la gestión de datos, si están disponibles.
Si una columna contiene datos de fecha y hora, se proporcionan las siguientes estadísticas:
- porcentaje que falta: el% de los valores de los datos que son NULL.
- Valores únicos: el número de valores únicos en los datos.
- Última fecha: la fecha más reciente, o la mayoría del futuro, en los datos.
- Fecha más temprana: la fecha más temprana en los datos.
- Intervalo: el intervalo de fechas (por ejemplo, mensual) en los datos.
- Observaciones: recomendaciones para la gestión de datos, si están disponibles.