Análise de dados preditiva
As ferramentas abrangem a exploração de dados, elementos especializados de preparação de dados para análise preditiva, modelagem preditiva, ferramentas para comparar e avaliar a eficácia de diferentes modelos, ferramentas para agrupar registros e campos de forma sistemática, e ferramentas para ajudar na Implantando soluções de análise preditiva.

Há seis ferramentas preditivas que têm suporte no banco de dados.
Quando uma ferramenta preditiva com suporte de banco de dados é colocada na tela com outra ferramenta em-dB, a ferramenta preditiva muda automaticamente para a versão em-dB. Para alterar a versão da ferramenta, clique com o botão direito do mouse na ferramenta, aponte para escolher a versão da ferramenta e clique em uma versão diferente da ferramenta. Veja Visão geral do recurso Na base de dados para obter mais informações sobre suporte e ferramentas no banco de dados.
Microsoft SQL Server 2016 | Oracle | Teradata | |
---|---|---|---|
Ferramenta Modelo impulsionado | Sim | ||
Ferramenta de árvore de decisão | Sim | ||
Ferramenta do modelo da floresta | Sim | ||
Ferramenta de regressão linear | Sim | Sim | Sim |
Ferramenta de regressão logística | Sim | Sim | Sim |
Ferramenta Pontuação | Sim | Sim | Sim |
Ferramentas de análise preditiva

Esta categoria de ferramenta contém ferramentas para entender melhor os dados a serem usados em um projeto de análise preditiva e ferramentas para fazer tarefas de amostragem de dados especializadas para análise preditiva. As ferramentas para compreender melhor os dados que estão sendo usados em um projeto de análise preditiva incluem ferramentas de visualização e ferramentas que fornecem tabelas de estatísticas descritivas.
As ferramentas que ajudam um usuário a entender melhor os dados a serem analisados usando métodos visuais são:
- Resumo do campo
- Diagrama de calor
- Histograma
- Diagrama de médias
- Diagrama de dispersão
- Gráfico de violino
As ferramentas que fornecem estatísticas de resumo úteis para ajudar o usuário a compreender melhor os dados que estão sendo analisados são:

Esta categoria inclui ferramentas para a modelagem preditiva geral para a classificação (campo de destino categórico) e os modelos de regressão (campo de destino numérico), bem como ferramentas para comparação de modelos e para testes de hipóteses relevantes para previsões Modelagem. O conjunto de ferramentas para modelagem preditiva geral pode ser ainda mais discriminado em modelos estatísticos tradicionais, e mais modernos métodos de aprendizagem estatística. Uma única ferramenta de Pontuação fornece um mecanismo para a obtenção de previsões de modelo de ambos os tipos de ferramentas gerais de modelagem preditiva.
Uma distinção importante entre os modelos estatísticos tradicionais e os métodos de aprendizado estatístico mais modernos é o nível de intervenção direta do usuário no processo de modelagem. Os modelos estatísticos tradicionais requerem um nível muito maior de intervenção do usuário e expertise, a fim de desenvolver um modelo com um nível adequado de eficácia preditiva. Especificamente, o usuário deve selecionar previamente os campos de previsão importantes e provavelmente precisará aplicar transformações apropriadas para os campos numéricos para capturar efeitos não-lineares entre o campo de destino e os preditores contínuos. Selecionando os preditores importantes (ignorando possíveis problemas devido a relações não-lineares) pode ser auxiliado através do uso de regressão gradual para os modelos tradicionais. Em contrapartida, os métodos de aprendizado estatístico modernos fazem uso de algoritmos que abordam internamente a seleção do preditor e as possíveis relações não-lineares entre os preditores de destino e numéricos.
Os modelos estáticos tradicionais diferem uns dos outros com base na natureza do campo-alvo que está sendo previsto. Todos eles são baseados em estimativas (generalizadas) modelos lineares. Embora todos os algoritmos de aprendizagem estatística têm a mesma propriedade de manipulação de preditor internamente a seleção e efeitos não-lineares, eles diferem em suas abordagens. Como resultado, nenhum método único supera todos os outros em todo o conjunto de problemas que um usuário pode encontrar.

As ferramentas de teste AB auxiliam o usuário na realização de testes a/B (também conhecidos como teste e aprendizado), como examinar o efeito de uma nova campanha de comunicação de marketing sobre as vendas, ou o efeito de mudar os níveis de pessoal da loja. As ferramentas podem ajudar na determinação de áreas de mercado para um teste (geralmente para um que envolve publicidade em massa de mídia, onde todos residentes nessa área podem potencialmente ser expostos à publicidade), combinando uma ou mais unidades de controle para cada unidade de tratamento, desenvolvendo a tendência e as medidas de sazonalidade em que a correspondência dos controlos aos tratamentos é frequentemente baseada, e fazendo a análise real dos resultados experimentais. As ferramentas associadas a esta subcategoria são:

Esta categoria contém um número de regular (em termos do intervalo de tempo de dados, como mensal), univariada vezes série plotagem e ferramentas de previsão. Central entre eles estão ferramentas para criar ARIMA e ampliação exponencial de suavização de modelos de previsão que pode ser usado para criar itens como um modelo de previsão semanal de vendas. Esses dois métodos desenvolvem previsões baseadas em elementos sistemáticos e relacionados a tempo nos valores da variável Target. Especificamente, eles pegam elementos de tendência (a longo prazo, bastante consistente movimento ascendente ou descendente na variável-alvo) e sazonalidade (padrões cíclicos que se repetem ao longo do tempo).
Para fornecer um exemplo concreto desses elementos, um modelo de série temporal de vendas de computadores tablet provavelmente revelaria uma tendência positiva nas vendas, juntamente com um forte padrão sazonal de vendas mais altas perto do Natal e antes do início do ano letivo. Se nenhuma tendência ou sazonalidade estiver presente na variável de destino, os valores de previsão da variável de destino provavelmente cairão em uma linha reta com base no valor médio ponderado do destino para os valores mais recentes do destino. Isso é susceptível de ser um achado insatisfatório para um usuário, mas ele indica que não há nenhuma estrutura real nos dados em relação a apenas elementos relacionados tempo (tendência e sazonalidade). Nesses casos, métodos mais gerais de modelagem preditiva podem ser mais úteis no desenvolvimento de previsões do que as ferramentas da série temporal.
Além das ferramentas para criar previsões, existem ferramentas para ajudar o usuário a comparar a eficácia relativa de diferentes modelos de previsão de séries de tempos. O conjunto completo de ferramentas de série temporal inclui:

Esta categoria contém ferramentas para agrupar registros ou campos em um número menor de grupos. Aplicativos comuns para agrupar registros é criar segmentos de cliente com base em padrões de compra ou criar um conjunto de grupos de lojas. O objetivo final do agrupamento nestas duas áreas é criar um número menor de grupos que permite a personalização de programas e atividades de uma forma que é viável a partir de uma perspectiva de negócio.
Por exemplo, um varejista que tem 500 saídas em sua rede provavelmente encontrá-lo esmagadora para desenvolver um programa de merchandising e preços que foi específico para cada um dos 500 Outlets. No entanto, se as saídas são colocadas em um conjunto menor de grupos de lojas (digamos 10) com base na semelhança dos pontos de venda com relação aos seus padrões de vendas, criando 10 diferentes merchandising e programas de preços é algo que o varejista pode implementar com sucesso. Da mesma forma, muitas organizações têm tabelas de banco de dados que desejam analisar que são muito amplas, com muitos dos campos altamente correlacionados uns com os outros. Nestes casos, lidar com um grande número de medidas altamente correlacionadas complica substancialmente todas as análises feitas com estes dados. Como resultado, pode fazer sentido reduzir o conjunto original de campos em um conjunto menor de campos compostos que mais prontamente se prestam à análise. Em ambos os casos, há uma necessidade de reduzir a dimensionalidade dos dados para torná-lo acionável.
O método mais comum usado para agrupar registros em conjunto é a análise de cluster. Há realmente muitos tipos diferentes de análise de cluster, mas de longe os métodos de clustering mais comumente usados em aplicativos de negócios são baseados em algoritmos K-centróides. Alteryx fornece ferramentas para ajudar a determinar o número apropriado de clusters (grupos) que devem ser formados, criando o conjunto final de clusters e anexando o cluster de um registro específico pertence (independentemente se o registro foi usado na determinação do conjunto de clusters) para os dados. Uma ferramenta relacionada (localizar vizinhos mais próximos) permite que o usuário Forme grupos ad hoc de um determinado tamanho em torno de um ou mais registros específicos. Por exemplo, as ferramentas fornece ao usuário a capacidade de encontrar os cinco clientes mais como o cliente "X" com base no comportamento de compra passado. O método disponível para agrupar campos é componentes principais.
As ferramentas de análise de cesta de mercado ajudam a determinar quais itens vão juntos no ponto de dados de vendas, ou a combinação de problemas tendem a coexistir em sistemas de relatórios de defeitos e ordem de trabalho. As ferramentas na categoria determinam o conjunto de "regras" nos dados (como "defeito do produto a é mais provável que esteja presente quando os defeitos do produto B e C também são observados"), e fornecem ferramentas de filtragem para ajudar a restringir a lista de regras possíveis com base em um conjunto de critérios que estão associadas a regras que são mais susceptíveis de torná-los praticamente mais importante.
As ferramentas nesta categoria incluem:

Esta categoria inclui ferramentas que podem ajudar a determinar o melhor curso de ação ou resultado de uma determinada situação ou conjunto de cenários. Ele pode ajudar a aumentar a produção de modelos preditivos, prescrevendo uma ação ideal.