Investigação de dados
A categoria de ferramenta de investigação de dados inclui ferramentas para a compreensão dos dados a serem usados em um projeto de análise preditiva e ferramentas para a realização de tarefas de amostragem de dados especializadas para análise preditiva.
Ferramenta de análise de associação: A ferramenta de análise de associação determina quais campos em um banco de dados têm uma associação bivariada entre si.
Ferramenta básica de perfil de dados: A ferramenta básica de perfil de dados gera metadados básicos, como tipo de dados, min, Max, Average, número de valores ausentes, etc.
Ferramenta de tabela de contingência: A ferramenta de tabela de contingência cria uma tabela de contingência baseada em campos selecionados, para listar todas as combinações dos valores de campo com colunas de freqüência e porcentagem.
Ferramenta de análise de distribuição: A ferramenta de análise de distribuição se encaixa em uma ou mais distribuições aos dados de entrada e as compara com base em uma série de estatísticas de bondade de ajuste.
Ferramenta Resumo do campo: A ferramenta de Resumo de campo analisa dados e cria um relatório de resumo contendo estatísticas descritivas de dados em colunas selecionadas. Use a ferramenta Resumo de campo para obter informações sobre dados e receber recomendações para o gerenciamento de dados.
Ferramenta de tabela de freqüência: A ferramenta de tabela de freqüência produz uma análise de freqüência para campos selecionados. A saída inclui um resumo dos campos selecionados com contagens de freqüência e porcentagens para cada valor em um campo.
Ferramenta de enredo de calor: A ferramenta trama de calor usa um mapa de cores de plotagem térmica para mostrar a distribuição conjunta de duas variáveis que são variáveis numéricas contínuas ou categorias ordenadas.
Ferramenta de histograma: A ferramenta histograma fornece uma plotagem de histograma para um campo numérico, mostrando as freqüências dos registros que caem em um conjunto de intervalos de valores contínuos. Ele também fornece uma parcela de densidade empírica suavizada. As frequências serão exibidas quando um diagrama de densidade não estiver selecionado, e as probabilidades serão exibidas quando essa opção estiver selecionada.
Ferramenta pesos importância: A ferramenta pesos da importância fornece métodos para selecionar um jogo das variáveis a usar-se em um modelo preditivo baseado em como fortemente relacionou cada preditor possível é à variável do alvo.
Ferramenta de correlação de Pearson: A ferramenta de correlação de Pearson mede a dependência linear entre duas variáveis, bem como a covariância.
Trama da ferramenta de meios: O enredo da ferramenta de meios tem um campo numérico ou binário categórico (com o campo categórico binário convertido em um conjunto de zero e um valores) como um campo de resposta, juntamente com um campo categórico e plota a média do campo de resposta para cada uma das categorias (nível s) do campo categórico.
Ferramenta dispersão: A ferramenta dispersão torna scatterplots aprimorada, com opções para incluir boxplots nas margens, uma linha de regressão linear, uma curva suave através de regressão não-paramétrica, uma propagação condicional suavizada, identificação de atípica e uma linha de regressão.
Ferramenta Correlação de Spearman: A ferramenta de correlação de Spearman avalia o quão bem uma função monotônica arbitrária pode descrever a relação entre duas variáveis, sem fazer quaisquer outras suposições sobre a natureza particular da relação entre as variáveis.
Ferramenta do enredo do violino: A ferramenta enredo do violino exibe a distribuição de uma única variável numérica e transmite a densidade da distribuição.