Basic Data Profile Tool Icon

Ferramenta Perfil De Dados Básico

Versão:
2023.1
Last modified: March 10, 2022

A ferramenta básica de perfil de dados analisa dados e fornece metadados para cada coluna (campo) de dados.

Use a ferramenta Perfil de dados de base para ter uma visão geral, ou um perfil, dos dados e realizar a saída das informações para análise. Para ver uma representação visual do perfil de dados, além dos metadados, use uma ferramenta Navegar. Consulte ferramenta de navegação.

Configuração da ferramenta

Complete qualquer uma das opções de configuração opcionais:

  • Limite para contagem exata: O limite padrão é recomendado para melhor desempenho. Aumente o limite para ver informações de perfil para obter mais dados. Digite ou clique para selecionar o número máximo de valores exclusivos que você deseja que o Alteryx identifique nos dados.
  • Limite de tamanho para retornar todos os valores exclusivos (caracteres): O limite padrão é recomendado para melhor desempenho. Aumente o limite para ver informações de perfil para obter mais dados. Digite ou clique para selecionar o número máximo de caracteres que você deseja Alteryx para verificar em um valor para determinar se o valor é exclusivo.
  • Use unidades métricas: Selecione para usar unidades de medida métricas. Esta opção aplica-se apenas aos dados espaciais.

Visualizar a saída

Dependendo do tipo de dados da ferramenta Connect, as informações de perfil de dados na janela resultados variam. Consulte Tipos de dados para obter uma lista de tipos de dados.

Os resultados são listados verticalmente. Role para ver os metadados de cada coluna nos dados.

Dados de cadeia de caracteres (String)

Se uma coluna contiver valores de cadeia de caracteres, os seguintes metadados são fornecidos:

  • Nome: o nome da coluna.
  • Tipo de dados: o tipo de dados da coluna selecionada.
  • Tamanho: a quantidade de memória reservada para cada registro nessa coluna.
  • Fonte: A origem da coluna. Isso poderia ser o nome da fonte de dados ou o caminho para o local onde os dados são salvos.
  • Descrição: A descrição da coluna, se disponível. Se nenhuma descrição estiver disponível, é [nulo].
  • Nulos: o número de valores na coluna que são nulos, excluindo valores vazios.
  • Não nulos: o número de entradas não nulas e não vazias na coluna.
  • Em branco: o número de valores vazios.
  • Valores com espaço em branco à esquerda: o número de valores de cadeia de caracteres com espaços em branco antes do valor. Use a ferramenta Limpeza de Dados ou a função "trim" da ferramenta Fórmula para resolver o problema. Consulte ferramenta de limpeza de dados e fórmula Tool.
  • Valores com espaço em branco à direita: o número de valores de cadeia de caracteres com espaços em branco após o valor.
  • Valores com ambos os espaços em branco: O número de valores de cadeia de caracteres com espaço em branco antes e depois do valor.
  • Comprimento médio: o comprimento médio dos valores da coluna.
  • Comprimento mais longo: o número de caracteres no valor mais longo da coluna.
  • Valor mais longo: o valor mais longo da coluna.
  • Comprimento mais curto (não em branco): o número de caracteres no valor mais curto da coluna.
  • Valor mais curto: o valor mais curto da coluna.
  • Mínimo: A primeira entrada de cadeia de caracteres em uma coluna que é classificada alfabeticamente.
  • Máximo: A última entrada de cadeia de caracteres em uma coluna que é classificada alfabeticamente.
  • Uniques: O número de valores exclusivos no campo. Use a ferramenta Exclusivo para ver uma contagem completa das entradas exclusivas e duplicadas. Consulte Ferramenta Exclusivo.
  • Valores únicos: Todos os valores exclusivos na coluna.

Dados numéricos

Se uma coluna contiver valores numéricos, os seguintes metadados são fornecidos:

  • Nome: o nome da coluna.
  • Tipo de dados: o tipo de dados da coluna selecionada.
  • Tamanho: a quantidade de memória reservada para cada registro nessa coluna.
  • Fonte: A origem da coluna. Isso poderia ser o nome da fonte de dados ou o caminho para o local onde os dados são salvos.
  • Descrição: A descrição da coluna, se disponível. Se nenhuma descrição estiver disponível, é [nulo].
  • Nulos: o número de valores na coluna que são nulos, excluindo valores vazios.
  • Não nulos: o número de entradas não nulas e não vazias na coluna.
  • Mínimo: o menor valor na coluna.
  • Máximo: o maior valor na coluna.
  • Média: o valor médio dos valores na coluna.
  • Desvio padrão: a medida de dispersão dos valores no gráfico.
  • Variância: a medida de quão longe um conjunto de números aleatórios está em relação à média.
  • Uniques: O número de valores exclusivos no campo. Use a ferramenta Exclusivo para ver uma contagem completa das entradas exclusivas e duplicadas. Consulte Ferramenta Exclusivo.
  • Valores únicos: Todos os valores exclusivos na coluna.
  • Percentil 25: o valor mediano na primeira metade, ou metade inferior, dos dados.
  • Percentil 50: o valor mediano dos dados.
  • Percentil 75: o valor mediano na segunda metade, ou metade superior, dos dados.
  • Histograma: A contagem de valores na coluna que se enquadram em dados agrupados uniformemente. Cada grupo é indicado por um valor inicial e uma contagem de valores no grupo, separados por dois pontos. Um grupo contém valores até mas não incluindo o valor inicial do próximo grupo. 1:23, 2:15, 3:0 indica três grupos a partir de 1, 2 e 3. Cada grupo tem 23, 15 e 0 itens respectivamente.
  • Margem de erro: O intervalo possível de valores em e sobre o valor calculado.

Dados de data/hora

Se uma coluna contiver dados de data/hora, os seguintes metadados são fornecidos:

  • Nome: o nome da coluna.
  • Tipo de dados: o tipo de dados da coluna selecionada.
  • Tamanho: a quantidade de memória reservada para cada registro nessa coluna.
  • Fonte: A origem da coluna. Isso poderia ser o nome da fonte de dados ou o caminho para o local onde os dados são salvos.
  • Descrição: A descrição da coluna, se disponível. Se nenhuma descrição estiver disponível, é [nulo].
  • Nulos: o número de valores na coluna que são nulos, excluindo valores vazios.
  • Não nulos: o número de entradas não nulas e não vazias na coluna.
  • Data Histograma: (Apenas para dados de data) A contagem de valores na coluna que se enquadram em dados agrupados uniformemente. Cada grupo é indicado por um valor inicial e uma contagem de valores no grupo, separados por dois pontos. Um grupo contém valores até mas não incluindo o valor inicial do próximo grupo. 1:23, 2:15, 3:0 indica três grupos a partir de 1, 2 e 3. Cada grupo tem 23, 15 e 0 itens respectivamente.
  • Mínimo: o menor valor na coluna.
  • Máximo: o maior valor na coluna.
  • Uniques: O número de valores exclusivos no campo. Use a ferramenta Exclusivo para ver uma contagem completa das entradas exclusivas e duplicadas. Consulte Ferramenta Exclusivo.
  • Valores únicos: Todos os valores exclusivos na coluna.

Dados de objetos espaciais

Se uma coluna contiver objetos espaciais, os seguintes metadados são fornecidos:

  • Nome: o nome da coluna.
  • Tipo de dados: o tipo de dados da coluna selecionada.
  • Tamanho: a quantidade de memória reservada para cada registro nessa coluna.
  • Fonte: A origem da coluna. Isso poderia ser o nome da fonte de dados ou o caminho para o local onde os dados são salvos.
  • Descrição: A descrição da coluna, se disponível. Se nenhuma descrição estiver disponível, é [nulo].
  • Nulos: o número de valores na coluna que são nulos, excluindo valores vazios.
  • Não nulos: o número de entradas não nulas e não vazias na coluna.
  • Tamanho médio (bytes):    O dimensionar médio na memória que este objeto ocupa.
  • Tamanho o maior (bytes):  O dimensionar na memória do maior objeto na coluna.
  • Ponto de contagem:   O número de objetos espaciais na coluna que são pontos.
  • Linha de contagem:   O número de objetos espaciais na coluna que são linhas.
  • Contagem PolyPolyline:    O número de objetos espaciais na coluna que são polilinhas.
  • Retângulo de contagem:    O número de objetos espaciais na coluna que são retângulos.
  • Polígono de contagem:   O número de objetos espaciais na coluna que são polígonos.
  • Contagem multiponto:  O número de objetos espaciais na coluna que são multipontos.
  • Número médio de peças: O número médio de partes nos objetos espaciais dentro da coluna.
  • Maior número de peças: O maior número de partes nos objetos espaciais dentro da coluna.
  • Número médio de pontos: O número médio de pontos nos objetos espaciais dentro da coluna.
  • Maior número de pontos: O maior número de pontos nos objetos espaciais dentro da coluna.
  • Comprimento o mais longo: O comprimento mais longo nos objetos espaciais dentro da coluna.
  • Maiorárea: a maior área em quilômetros quadrados ou quilômetros quadrados.
Esta página foi útil?

Problemas com seu produto Alteryx? Visite a Comunidade Alteryx ou entre em contato com nossa Equipe de Suporte. Não é possível enviar este formulário? Envie-nos um e-mail.