Herramienta Perfil básico de datos
La herramienta básica de perfiles de datos analiza los datos y proporciona metadatos para cada columna (campo) de los datos.
Utilice la herramienta Perfil básico de datos para ver una descripción, o perfil, de datos y emitir la información para análisis adicionales. Para ver una representación visual del perfil de datos, además de los metadatos, usa la herramienta Examinar. Consulta Herramienta Examinar.
Configurar la herramienta
Complete cualquiera de las opciones de configuración opcionales:
- Límite para conteo exacto: se recomienda el límite por defecto para un mejor rendimiento. Aumente el límite para ver la información de perfil para más datos. Escriba o haga clic para seleccionar el número máximo de valores únicos que desea que Alteryx identifique en los datos.
- Límite de tamaño para devolver todos los valores únicos (caracteres): se recomienda el límite por defecto para un mejor rendimiento. Aumente el límite para ver la información de perfil para más datos. Escriba o haga clic para seleccionar el número máximo de caracteres que desea que Alteryx para comprobar un valor para determinar si el valor es único.
- Use unidades métricas: Seleccione para usar unidades métricas de medida. Esta opción sólo se aplica a los datos espaciales.
Ver la salida
Dependiendo del tipo de datos de la herramienta Connect, la información del perfil de datos en la ventana de resultados varía. Consulta Tipos de datos, para obtener una lista de tipos de datos.
Los resultados se enumeran verticalmente. Desplácese para ver los metadatos de cada columna de los datos.
Si una columna contiene valores de cadena, se proporcionan los siguientes metadatos:
- Nombre: nombre de la columna.
- Tipo de datos: el tipo de datos de la columna seleccionada.
- Tamaño: la cantidad de memoria reservada para cada registro de esta columna.
- Fuente: origen de la columna. Este podría ser el nombre del origen de datos o la ruta de acceso a la ubicación en la que se guardan los datos.
- Descripción: la descripción de la columna, si está disponible. Si no hay ninguna descripción disponible, es [null].
- Nulos: número de valores de la columna que son nulos, excluyendo los valores vacíos.
- No nulas: número de entradas que no son nulas en la columna, incluidos los valores vacíos.
- Espacios en blanco: el número de valores vacíos.
- Valores con espacios en blanco al principio: número de valores de cadena con espacio en blanco antes del valor. Utiliza la herramienta Limpieza de datos o la función de ajuste de la herramienta Fórmula para resolver el problema. Consulta Herramienta Limpieza de datos y Herramienta Fórmula.
- Valores con espacios en blanco al final: número de valores de cadena con espacios en blanco después del valor.
- Valores con ambos espacios en blanco: el número de valores de cadena con espacios en blanco antes y después del valor.
- Longitud media: la longitud media de los valores en la columna.
- Longitud más larga: número de caracteres en el valor más largo de la columna.
- Valor más largo: el valor más largo de la columna.
- Longitud más corta (no en blanco): número de caracteres en el valor más corto de la columna.
- Valor más corto: el valor más corto de la columna.
- Mínimo: la primera entrada de cadena en una columna ordenada alfabéticamente.
- Máximo: la última entrada de cadena en una columna ordenada alfabéticamente.
- Únicos: el número de valores únicos en el campo. Utiliza la herramienta Único para ver un conteo completo de entradas únicas y duplicadas. Consulta Herramienta Único.
- Valores únicos: todos los valores únicos en la columna.
Si una columna contiene valores numéricos, se proporcionan los siguientes metadatos:
- Nombre: nombre de la columna.
- Tipo de datos: el tipo de datos de la columna seleccionada.
- Tamaño: la cantidad de memoria reservada para cada registro de esta columna.
- Fuente: origen de la columna. Este podría ser el nombre del origen de datos o la ruta de acceso a la ubicación en la que se guardan los datos.
- Descripción: la descripción de la columna, si está disponible. Si no hay ninguna descripción disponible, es [null].
- Nulos: número de valores de la columna que son nulos, excluyendo los valores vacíos.
- No nulas: número de entradas que no son nulas en la columna, incluidos los valores vacíos.
- Mínimo: el valor más pequeño de la columna.
- Máximo: el valor más grande en la columna.
- Promedio: valor medio de los valores de la columna.
- Desviación estándar: la medida de la dispersión de los valores que se encuentran en el gráfico.
- Varianza: la medida de hasta qué punto un conjunto de números aleatorios se dispersa de la media.
- Únicos: el número de valores únicos en el campo. Utiliza la herramienta Único para ver un conteo completo de entradas únicas y duplicadas. Consulta Herramienta Único.
- Valores únicos: todos los valores únicos en la columna.
- Percentil 25: el valor medio en la parte inferior o la primera mitad de los datos.
- Percentil 50: el valor medio de los datos.
- Percentil 75: el valor medio en la parte superior, o la segunda, la mitad de los datos.
- Histograma: el conteo de valores de la columna que caen en datos agrupados uniformemente. Cada grupo se indica mediante un valor inicial y un conteo de valores en el grupo, separados por dos puntos. Un grupo contiene valores hasta pero sin incluir el valor inicial del siguiente grupo. 1:23, 2:15, 3:0 indica tres grupos que empiezan en 1, 2 y 3. Cada grupo tiene 23, 15 y 0 ítems respectivamente.
- Margen de error: el posible rango de valores bajo y sobre el valor calculado.
Si una columna contiene datos de fecha y hora, se proporcionan los siguientes metadatos:
- Nombre: nombre de la columna.
- Tipo de datos: el tipo de datos de la columna seleccionada.
- Tamaño: la cantidad de memoria reservada para cada registro de esta columna.
- Fuente: origen de la columna. Este podría ser el nombre del origen de datos o la ruta de acceso a la ubicación en la que se guardan los datos.
- Descripción: la descripción de la columna, si está disponible. Si no hay ninguna descripción disponible, es [null].
- Nulos: número de valores de la columna que son nulos, excluyendo los valores vacíos.
- No nulas: número de entradas que no son nulas en la columna, incluidos los valores vacíos.
- Histogramade fecha: (sólo para datos de fecha) el conteo de valores de la columna que caen en datos agrupados uniformemente. Cada grupo se indica mediante un valor inicial y un conteo de valores en el grupo, separados por dos puntos. Un grupo contiene valores hasta pero sin incluir el valor inicial del siguiente grupo. 1:23, 2:15, 3:0 indica tres grupos que empiezan en 1, 2 y 3. Cada grupo tiene 23, 15 y 0 ítems respectivamente.
- Mínimo: el valor más pequeño de la columna.
- Máximo: el valor más grande en la columna.
- Únicos: el número de valores únicos en el campo. Utiliza la herramienta Único para ver un conteo completo de entradas únicas y duplicadas. Consulta Herramienta Único.
- Valores únicos: todos los valores únicos en la columna.
Si una columna contiene objetos espaciales, se proporcionan los siguientes metadatos:
- Nombre: nombre de la columna.
- Tipo de datos: el tipo de datos de la columna seleccionada.
- Tamaño: la cantidad de memoria reservada para cada registro de esta columna.
- Fuente: origen de la columna. Este podría ser el nombre del origen de datos o la ruta de acceso a la ubicación en la que se guardan los datos.
- Descripción: la descripción de la columna, si está disponible. Si no hay ninguna descripción disponible, es [null].
- Nulos: número de valores de la columna que son nulos, excluyendo los valores vacíos.
- No nulas: número de entradas que no son nulas en la columna, incluidos los valores vacíos.
- Tamaño medio (bytes): tamaño medio en la memoria que este objeto ocupa.
- Tamaño más grande (bytes): tamaño en memoria del objeto más grande de la columna.
- Punto de conteo: número de objetos espaciales en la columna que son puntos.
- Línea Count: número de objetos espaciales en la columna que son líneas.
- Recuento de polilínea: número de objetos espaciales en la columna que son polilíneas.
- Recuentode rectángulo: número de objetos espaciales en la columna que son rectángulos.
- Conteo Polygon: número de objetos espaciales en la columna que son polígonos.
- Conteo multipunto: número de objetos espaciales en la columna que son multi-puntos.
- Número medio de piezas: el número medio de partes de los objetos espaciales dentro de la columna.
- Mayor número de partes: el mayor número de partes de los objetos espaciales dentro de la columna.
- Número medio de puntos: el número medio de puntos en los objetos espaciales dentro de la columna.
- Mayor número de puntos: el mayor número de puntos de los objetos espaciales dentro de la columna.
- Longitud más larga: la longitud más larga en los objetos espaciales dentro de la columna.
- El área más grande: el área más grande en millas cuadradas o kilómetros cuadrados.