Ferramenta Resumo do campo
A ferramenta de Resumo de campo analisa dados e cria um relatório de resumo contendo estatísticas descritivas de dados em colunas selecionadas.
Use a ferramenta Resumo de campo para obter informações sobre dados e receber recomendações para o gerenciamento de dados.
Numérico, Cadeia de caracteres, espacial e data/hora são suportados nesta ferramenta. Um conjunto exclusivo de estatísticas descritivas são fornecidos para cada tipo de dados. Veja Tipos de dados para mais informações sobre tipos de dados.
Configure a ferramenta
Selecione tudo, alguns ou um exemplo aleatório de colunas para incluir na saída.
Colunas que contêm dados não suportados nesta ferramenta, como dados booleanos, podem ser selecionadas durante a configuração da ferramenta; no entanto, a coluna não é analisada ou incluída na saída da ferramenta.
- Selecione os campos para informações de resumo do produto: selecione as colunas a serem analisadas e incluídas na saída.
- All: clique para selecionar todas as colunas nos dados.
- None: clique para desmarcar colunas previamente selecionadas.
- Dados de entrada de exemplo: Selecione para incluir um exemplo de colunas na saída em vez de selecionar todas ou colunas específicas.
- Random N registros: selecione o número de registros a serem incluídos na saída.
- N% aleatório de registros: selecione a porcentagem de registros de entrada a serem incluídos na saída.
Visualizar a saída
A ferramenta de Resumo de campo tem três saídas:
- O Anchor: um fluxo de dados Alteryx com estatísticas descritivas para colunas selecionadas juntamente com recomendações, na coluna comentários, para gerenciar dados.
- R Anchor: um relatório estático com uma estatística dispersão e descritiva para colunas selecionadas juntamente com recomendações (consulte comentários) para gerenciar dados em uma coluna. Para exibir o relatório, adicione uma ferramenta procurar e conecte-a à saída R. Veja Ferramenta Navegar.
- Eu âncora: um painel interativo consistindo de painéis expansíveis para cada coluna. Para exibir o relatório, adicione uma ferramenta procurar e conecte-a à saída I. Veja Ferramenta Navegar. Cada painel consiste em um gráfico de histograma ou coluna e estatísticas sumárias:
- Passe o mouse sobre um painel para exibir ícones adicionais.
- Clique no ícone de informações para visualizar informações adicionais
- Clique no ícone expandir para abrir o relatório em uma exibição detalhada.
- Passe o mouse sobre uma barra na trama para exibir detalhes.
- Selecione variável para exibir para focalizar um conjunto menor de colunas.
- Classificar os painéis alfabeticamente ou por porcentagem de valores ausentes.
- Passe o mouse sobre um painel para exibir ícones adicionais.
As estatísticas descritivas disponíveis na saída dependem do tipo de dados nas colunas selecionadas para análise. Os resultados são listados horizontalmente. Role da esquerda para a direita para ver as estatísticas de cada tipo de dados.
Se uma coluna contiver dados numéricos, serão fornecidas as seguintes estatísticas:
- Min: o valor mínimo nos dados.
- Max: o valor máximo nos dados.
- Mediana: o valor mediano nos dados.
- Std. Dev.: a medida de como dispersos os valores estão nos dados.
- Porcentagemem falta: a porcentagem de valores nos dados que são NULL.
- Valores exclusivos: o número de valores exclusivos nos dados.
- médio: a média dos dados.
- Layout: Adicione uma ferramenta de navegação e conecte-a à saída R para visualizar as estatísticas em um formato visual. Veja Ferramenta Navegar.
- Observações: recomendações para o gerenciamento de dados, se disponível.
Se uma coluna contiver dados de cadeia de caracteres, serão fornecidas as seguintes estatísticas:
- Porcentagemem falta: a porcentagem de valores nos dados que são NULL.
- Valores exclusivos: o número de valores exclusivos nos dados.
- Valor mais curto: o valor de seqüência de caracteres abreviado (comprimento) nos dados.
- Valor mais longo: o valor de cadeia de caracteres mais longo (comprimento) nos dados.
- Contagem de valor min: o número de valores que equivalem ao valor mínimo.
- Max valor Count: o número de valores que igual o valor máximo.
- Observações: recomendações para o gerenciamento de dados, se disponível.
Se uma coluna contiver dados espaciais, serão fornecidas as seguintes estatísticas:
- Porcentagemem falta: a porcentagem de valores nos dados que são NULL.
- Tipode objeto: o tipo de objeto espacial (por exemplo, ponto ou polígono) nos dados.
- Área de AVG (milhas sq): a área média, em milhas quadradas, dos valores nos dados.
- Comprimento do AVG (milhas): o comprimento médio, em milhas, dos valores nos dados.
- AVG num pontos: o número médio de valores nos dados que são pontos.
- Observações: recomendações para o gerenciamento de dados, se disponível.
Se uma coluna contiver dados de data/hora, serão fornecidas as seguintes estatísticas:
- Porcentagemem falta: a porcentagem de valores nos dados que são NULL.
- Valores exclusivos: o número de valores exclusivos nos dados.
- Última data: o mais tardar, ou mais futuro, data nos dados.
- Data mais antiga: a data mais antiga dos dados.
- Intervalo: o intervalo de datas (por exemplo, mensal) nos dados.
- Observações: recomendações para o gerenciamento de dados, se disponível.