Ferramenta básica de perfil de dados
A ferramenta básica de perfil de dados analisa dados e fornece metadados para cada coluna (campo) de dados.
Use a ferramenta básica de perfil de dados para ver uma visão geral, ou perfil, de dados e a saída das informações para uma análise mais aprofundada. Para ver uma representação visual do perfil de dados, além dos metadados, use uma ferramenta Navegar. Veja Ferramenta Navegar.
Configure a ferramenta
Complete qualquer uma das opções de configuração opcionais:
- Limite para contagem exata: o limite padrão é recomendado para o melhor desempenho. Aumente o limite para ver informações de perfil para obter mais dados. Digite ou clique para selecionar o número máximo de valores exclusivos que você deseja que Alteryx identifique nos dados.
- Limite de tamanho para retornar todos os valores exclusivos (caracteres): o limite padrão é recomendado para o melhor desempenho. Aumente o limite para ver informações de perfil para obter mais dados. Digite ou clique para selecionar o número máximo de caracteres que você deseja Alteryx para verificar em um valor para determinar se o valor é exclusivo.
- Use unidades métricas: Selecione para usar unidades métricas de medida. Esta opção aplica-se apenas aos dados espaciais.
Visualizar a saída
Dependendo do tipo de dados da ferramenta Connect, as informações de perfil de dados na janela resultados variam. Veja Tipos de dados, para uma lista de tipos de dados.
Os resultados são listados verticalmente. Role para ver os metadados de cada coluna nos dados.
Dados de cadeia de caracteres
Se uma coluna contiver valores de cadeia de caracteres, os seguintes metadados são fornecidos:
- Nome: o nome da coluna.
- Tipo de dados: o tipo de dados da coluna selecionada.
- Tamanho: a quantidade de memória reservada para cada registro nesta coluna.
- Fonte: a origem da coluna. Isso poderia ser o nome da fonte de dados ou o caminho para o local onde os dados são salvos.
- Descrição: a descrição da coluna, se disponível. Se nenhuma descrição estiver disponível, ele é [NULL].
- Nulos: o número de valores na coluna que são nulos, excluindo valores vazios.
- Não nulas: o número de entradas não nulas na coluna, incluindo valores vazios.
- Espaços em branco: o número de valores vazios.
- Valores com espaço em branco antes: o número de valores de cadeia de caracteres com espaço em branco antes do valor. Use a ferramenta de limpeza de dados ou a função de correção da ferramenta de fórmula para resolver o problema. Veja Ferramenta Limpeza de dados e Ferramenta Fórmula.
- Valores com espaço em branco após: o número de valores de cadeia de caracteres com espaço em branco após o valor.
- Valores com ambos os espaços em branco: o número de valores de cadeia de caracteres com espaço em branco antes e depois do valor.
- Comprimento médio: o comprimento médio dos valores na coluna.
- Comprimento mais longo: o número de caracteres no valor mais longo da coluna.
- Valor mais longo: o valor mais longo da coluna.
- Comprimento mais curto (não em branco): o número de caracteres no valor mais curto na coluna.
- Valor mais curto: o valor mais curto na coluna.
- Mínimo: a primeira entrada de cadeia de caracteres em uma coluna que é classificada alfabeticamente.
- Máximo: a última entrada de cadeia de caracteres em uma coluna que é classificada alfabeticamente.
- Únicos: o número de valores exclusivos no campo. Use a ferramenta exclusiva para ver uma contagem completa de entradas exclusivas e duplicadas. Veja Ferramenta Exclusivo.
- Valores exclusivos: todos os valores exclusivos na coluna.
Dados numéricos
Se uma coluna contiver valores numéricos, os seguintes metadados são fornecidos:
- Nome: o nome da coluna.
- Tipo de dados: o tipo de dados da coluna selecionada.
- Tamanho: a quantidade de memória reservada para cada registro nesta coluna.
- Fonte: a origem da coluna. Isso poderia ser o nome da fonte de dados ou o caminho para o local onde os dados são salvos.
- Descrição: a descrição da coluna, se disponível. Se nenhuma descrição estiver disponível, ele é [NULL].
- Nulos: o número de valores na coluna que são nulos, excluindo valores vazios.
- Não nulas: o número de entradas não nulas na coluna, incluindo valores vazios.
- Mínimo: o menor valor na coluna.
- Máximo: o maior valor na coluna.
- Média: o valor médio dos valores na coluna.
- Desvio padrão: a medida de dispersão dos valores no gráfico.
- Variação: a medida de quão longe um conjunto de números aleatórios são dispersos da média.
- Únicos: o número de valores exclusivos no campo. Use a ferramenta exclusiva para ver uma contagem completa de entradas exclusivas e duplicadas. Veja Ferramenta Exclusivo.
- Valores exclusivos: todos os valores exclusivos na coluna.
- 25º percentil: o valor mediano nos dados inferiores ou primeiros ou metade dos dados.
- 50º percentil: o valor mediano dos dados.
- 75º percentil: o valor mediano nos dados superiores,segundo ou metade dos dados.
- Histograma: a contagem de valores na coluna que se enquadram em dados uniformemente agrupados. Cada grupo é indicado por um valor inicial e uma contagem de valores no grupo, separados por dois-pontos. Um grupo contém valores até mas não incluindo o valor inicial do próximo grupo. 1:23, 2:15, 3:0 indica três grupos a partir de 1, 2 e 3. Cada grupo tem 23, 15 e 0 itens respectivamente.
- Margem de erro: a possível faixa de valores e sobre o valor calculado.
Dados de data/hora
Se uma coluna contiver dados de data/hora, os seguintes metadados são fornecidos:
- Nome: o nome da coluna.
- Tipo de dados: o tipo de dados da coluna selecionada.
- Tamanho: a quantidade de memória reservada para cada registro nesta coluna.
- Fonte: a origem da coluna. Isso poderia ser o nome da fonte de dados ou o caminho para o local onde os dados são salvos.
- Descrição: a descrição da coluna, se disponível. Se nenhuma descrição estiver disponível, ele é [NULL].
- Nulos: o número de valores na coluna que são nulos, excluindo valores vazios.
- Não nulas: o número de entradas não nulas na coluna, incluindo valores vazios.
- Histogramade data: (somente para dados de data) a contagem de valores na coluna que se enquadram em dados uniformemente agrupados. Cada grupo é indicado por um valor inicial e uma contagem de valores no grupo, separados por dois-pontos. Um grupo contém valores até mas não incluindo o valor inicial do próximo grupo. 1:23, 2:15, 3:0 indica três grupos a partir de 1, 2 e 3. Cada grupo tem 23, 15 e 0 itens respectivamente.
- Mínimo: o menor valor na coluna.
- Máximo: o maior valor na coluna.
- Únicos: o número de valores exclusivos no campo. Use a ferramenta exclusiva para ver uma contagem completa de entradas exclusivas e duplicadas. Veja Ferramenta Exclusivo.
- Valores exclusivos: todos os valores exclusivos na coluna.
Dados de objetos espaciais
Se uma coluna contiver objetos espaciais, os seguintes metadados são fornecidos:
- Nome: o nome da coluna.
- Tipo de dados: o tipo de dados da coluna selecionada.
- Tamanho: a quantidade de memória reservada para cada registro nesta coluna.
- Fonte: a origem da coluna. Isso poderia ser o nome da fonte de dados ou o caminho para o local onde os dados são salvos.
- Descrição: a descrição da coluna, se disponível. Se nenhuma descrição estiver disponível, ele é [NULL].
- Nulos: o número de valores na coluna que são nulos, excluindo valores vazios.
- Não nulas: o número de entradas não nulas na coluna, incluindo valores vazios.
- Tamanho médio (bytes): o tamanho médio na memória que este objeto ocupa.
- Tamanho maior (bytes): o tamanho na memória do maior objeto na coluna.
- Pontode contagem: o número de objetos espaciais na coluna que são pontos.
- Linhade contagem: o número de objetos espaciais na coluna que são linhas.
- Contagem polipolie: o número de objetos espaciais na coluna que são polilinhas.
- Retângulode contagem: o número de objetos espaciais na coluna que são retângulos.
- Polígonode contagem: o número de objetos espaciais na coluna que são polígonos.
- Multipontode contagem: o número de objetos espaciais na coluna que são vários pontos.
- Número médio de peças: o número médio de peças nos objetos espaciais dentro da coluna.
- Maior número de partes: o maior número de peças nos objetos espaciais dentro da coluna.
- Número médio de pontos: o número médio de pontos nos objetos espaciais dentro da coluna.
- Maior número de pontos: o maior número de pontos nos objetos espaciais dentro da coluna.
- Comprimento mais longo: o comprimento mais longo nos objetos espaciais dentro da coluna.
- Maior área: a maior área em milhas quadradas ou quilômetros quadrados.