Análise Preditiva
O Designer inclui um conjunto de ferramentas preditivas que usamR, uma base de código-fonte abertousada para análise estatística e preditiva.
As ferramentas abrangem a exploração de dados, elementos especializados de preparação de dados para análise preditiva, modelagem preditiva, ferramentas para comparar e avaliar a eficácia de diferentes modelos, ferramentas para agrupar registros e campos de formas sistemáticas e ferramentas para ajudar na implantação de soluções de análise preditiva.
As ferramentas de previsão utilizam a linguagem de programação R. Vá para Opções > Baixar ferramentas preditivas e faça login no portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela Ferramenta R.
Suporte no banco de dados
Há seis ferramentas preditivas que têm suporte no banco de dados.
Quando uma ferramenta preditiva com suporte no banco de dados é colocada na tela com outra ferramenta no banco de dados, a ferramenta preditiva muda automaticamente para a versão no banco de dados. Para alterar a versão da ferramenta, clique com o botão direito do mouse na ferramenta, aponte para escolher versão da ferramenta e selecione uma versão diferente da ferramenta. Consulte Visão geral do recurso Na Base de Dados para obter mais informações sobre suporte e ferramentas de base de dados.
Microsoft SQL Server | Oracle | Teradata | |
---|---|---|---|
Ferramenta Modelo Impulsionado | Sim | ||
Regressor de árvore de decisão | Sim | ||
Ferramenta Modelo impulsionado | Sim | ||
Ferramenta de regressão linear | Sim | Sim | Sim |
Modelo de regressão logística | Sim | Sim | Sim |
Ferramenta Pontuação | Sim | Sim | Sim |
Aprimoramentos na análise preditiva
Ferramentas de Saúde dos Dados
Esta categoria de ferramenta contém ferramentas para melhor compreensão dos dados a serem usados em um projeto de análise preditiva e ferramentas para realizar tarefas especializadas de amostragem de dados para análise preditiva. As ferramentas para entender melhor os dados que estão sendo usados em um projeto de análise preditiva incluem ferramentas de visualização e ferramentas que fornecem tabelas de estatísticas descritivas.
As ferramentas que ajudam o usuário a entender melhor os dados a serem analisados usando métodos visuais são:
As ferramentas que fornecem estatísticas de resumo úteis para ajudar o usuário a entender melhor os dados que estão sendo analisados são:
Ferramenta Análise De Associação
Ferramenta Perfil De Dados Básico
Ferramenta Tabela De Contingência
Ferramenta Análise De Distribuição
Ferramenta Tabela De Frequência
Ferramenta Pesos Importância
Ferramenta De Correlação De Pearson
Ferramenta Correlação De Spearman
Ferramentas preditivas
A categoria Preditivo inclui ferramentas para modelagem preditiva de modelos de classificação e de regressão, assim como ferramentas para comparação de modelos e para testes de hipóteses relevantes para modelagem preditiva. O conjunto de ferramentas para a modelagem preditiva geral pode ser ainda mais dividido em modelos estatísticos tradicionais e métodos de aprendizagem estatística mais modernos. Uma única ferramenta de Pontuação fornece um mecanismo para obter previsões de modelo de ambos os tipos de ferramentas gerais de modelagem preditiva.
Uma importante distinção entre os modelos estatísticos tradicionais e os métodos de aprendizagem estatística mais modernos é o nível de intervenção directa do utilizador no processo de modelização. Os modelos estatísticos tradicionais exigem um nível muito maior de intervenção e experiência do usuário para desenvolver um modelo com nível adequado de eficácia preditiva. Especificamente, o usuário deve pré-selecionar os importantes campos de previsão e provavelmente precisará aplicar transformações apropriadas aos campos numéricos para capturar efeitos não lineares entre o campo alvo e os preditores contínuos. A seleção dos preditores importantes (ignorando possíveis problemas devido a relações não lineares) pode ser assistida por meio do uso de regressão gradativa para os modelos tradicionais. Por outro lado, os métodos de aprendizagem estatística modernos utilizam algoritmos que abordam internamente a seleção de prognosticadores e possíveis relações não lineares entre os preditores alvo e numérico.
Os modelos estáticos tradicionais diferem uns dos outros com base na natureza do campo-alvo que está sendo previsto. Todos eles se baseiam em modelos lineares de estimativa (generalizada). Embora todos os algoritmos de aprendizagem estatística tenham a mesma propriedade de controlar internamente a seleção de prognosticadores e efeitos não lineares, eles diferem em suas abordagens. Como resultado, nenhum método individual supera todos os outros no conjunto de problemas que um usuário pode encontrar.
Ferramentas para modelos estatísticos tradicionais
Ferramentas para o método de Aprendizagem Estatística moderno
Ferramentas para comparação de modelos preditivos e testes de hipóteses
Ferramenta para prever valores para todas as ferramentas gerais de modelagem preditiva
Ferramenta Pontuação
Ferramenta para criar visualizações interativas de rede e principais estatísticas de resumo
Ferramenta Análise De Rede
Ferramentas para gerar modelos de sobrevivência e estimar o risco relativo e. Tempo médio de sobrevivência restrito
Ferramentas de teste AB
As ferramentas de teste AB ajudam o usuário a realizar experimentos DE TESTE A/B (também conhecidos como teste e aprendizado), como examinar o efeito de uma nova campanha de comunicação de marketing sobre vendas ou o efeito de alterar os níveis de pessoal da loja. As ferramentas podem ajudar a determinar as áreas de mercado para um teste (geralmente para um que envolve publicidade em mídia de massa onde todos que residem nessa área podem ser potencialmente expostos à publicidade), combinando uma ou mais unidades de controle a cada unidade de tratamento, desenvolver medidas de tendência e sazonalidade nas quais a associação de controles a tratamentos é frequentemente baseada e fazer a análise real dos resultados experimentais. As ferramentas associadas a esta subcategoria são:
Previsão de série temporal
Essa categoria contém várias ferramentas regulares (em termos de intervalo de tempo de dados, como mensal), de plotagem e previsão de séries de tempos univariados. Entre elas estão ferramentas para criar modelos de previsão de amortização exponencial estendida e ARIMA que podem ser usados para criar itens como um modelo de previsão de vendas semanal. Ambos os métodos desenvolvem previsões com base em elementos sistemáticos relacionados ao tempo nos valores da variável alvo. Especificamente, eles pegam elementos de tendência (movimento ascendente ou descendente mais longo, razoavelmente consistente na variável alvo) e sazonalidade (padrões cíclicos que se repetem ao longo do tempo).
Para fornecer um exemplo concreto desses elementos, um modelo de série temporal de vendas de computadores tablet provavelmente revelaria uma tendência positiva nas vendas, juntamente com um forte padrão sazonal de vendas mais altas perto do Natal e antes do início do ano escolar. Se nenhuma tendência ou sazonalidade estiver presente na variável alvo, é provável que os valores de previsão da variável alvo caiam em uma linha reta com base no valor médio ponderado do alvo para os valores mais recentes do alvo. É provável que este seja um achado não satisfatório para um usuário, mas indica que não há estrutura real nos dados com relação apenas a elementos relacionados ao tempo (tendência e sazonalidade). Nesses casos, métodos de modelagem preditiva mais gerais podem ser mais úteis no desenvolvimento de previsões do que as ferramentas da série temporal.
Além das ferramentas para a criação de previsões, existem ferramentas para ajudar o usuário a comparar a eficácia relativa de diferentes modelos de previsão de séries temporais. O conjunto completo de ferramentas de série temporal inclui:
Ferramentas de agrupamento preditivo
Esta categoria contém ferramentas para agrupar registros ou campos em um número menor de grupos. Aplicativos comuns para agrupar registros são criar segmentos de clientes com base em padrões de compra ou criar um conjunto de grupos de lojas. O objetivo final de agrupar nessas duas áreas é criar um número menor de grupos que permita a personalização de programas e atividades de uma forma que seja viável do ponto de vista comercial.
Por exemplo, um varejista que tem 500 pontos de venda em sua rede provavelmente acharia difícil desenvolver um programa de comercialização e preços específico para cada um dos 500 pontos de venda. No entanto, se os estabelecimentos forem colocados em um conjunto menor de grupos de lojas (por exemplo, 10) com base na semelhança dos estabelecimentos em relação aos seus padrões de vendas, criar 10 programas de comercialização e preços diferentes é algo que o varejista pode implementar com sucesso. Da mesma forma, muitas organizações têm tabelas de banco de dados que desejam analisar que são muito amplas, com muitos dos campos altamente correlacionados uns com os outros. Nesses casos, lidar com um grande número de medidas altamente correlacionadas complica muito qualquer análise feita com esses dados. Como resultado, pode fazer sentido reduzir o conjunto original de campos em um conjunto menor de campos compostos que se prestam mais prontamente à análise. Nesses dois casos, há a necessidade de reduzir a dimensionalidade dos dados para torná-los acionáveis.
O método mais comum usado para agrupar registros é a análise de cluster. Na verdade, há muitos tipos diferentes de análise de cluster, mas, de longe, os métodos de cluster mais usados em aplicativos de negócios são baseados em algoritmos K-Centroids. O Alteryx fornece ferramentas para ajudar a determinar o número apropriado de clusters (grupos) que devem ser formados, criando o conjunto final de clusters e anexando o cluster ao qual um determinado registro pertence (independentemente de o registro ter sido usado para determinar o conjunto de clusters) aos dados. Uma ferramenta relacionada (Localizar vizinhos mais próximos) permite que o usuário forme grupos ad hoc de um determinado tamanho em torno de um ou mais registros específicos. Por exemplo, as ferramentas fornecem ao usuário a capacidade de encontrar os cinco clientes mais parecidos com o "X" do cliente com base no comportamento de compra anterior. O método disponível para agrupar campos é componentes principais.
As ferramentas de Análise de cesta de mercado ajudam a determinar quais itens se combinam nos dados de ponto de vendas, ou a combinação de problemas tende a ocorrer em conjunto nos sistemas de relatórios de defeitos e de ordem de serviço. As ferramentas da categoria determinam o conjunto de "regras" nos dados (como "o defeito do produto A tem mais probabilidade de estar presente quando os defeitos do produto B e C também são observados"), e fornecer ferramentas de filtragem para ajudar a restringir a lista de possíveis regras com base em um conjunto de critérios que estão associados a regras que são mais propensas a torná-las praticamente mais importantes.
As ferramentas nesta categoria incluem:
Anexar Ferramenta De Cluster
Ferramenta Encontrar Vizinhos Mais Próximos
K-centróides Ferramenta De Análise De Cluster
K-centróides Ferramenta De Diagnóstico
Ferramenta De Afinidade MB
MB Inspecionar Ferramenta
Ferramenta De Regras De MB
Ferramenta De Escala Multidimensional
Ferramenta Componentes Principais
Ferramentas prescritivas
Esta categoria inclui ferramentas que podem ajudar a determinar o melhor curso de ação ou resultado para uma determinada situação ou conjunto de cenários. Ele pode ajudar a aumentar a produção de modelos preditivos ao prescrever uma ação ideal.