Skip to main content

Score Tool Ferramenta Pontuação

Fluxo de trabalho de exemplo

A ferramenta Pontuação tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.

A ferramenta Pontuação cria uma estimativa de uma variável-alvo aplicando um modelo R a um conjunto de variáveis preditoras fornecidas. Se a variável-alvo for categórica, ela fornece as probabilidades de um registro (com base na variável preditora) pertencer a cada categoria. Se a variável-alvo for contínua, ela faz uma estimativa do valor da variável-alvo. Embora possa ser usada para avaliar o desempenho de modelos, ela não faz isso sozinha.

Essa ferramenta utiliza a ferramenta R. Vá para "Opções" > "Baixar ferramentas preditivas" e faça login no portal de Downloads e Licenças da Alteryx para instalar o R e os pacotes usados pela ferramenta R. Visite Baixar e utilizar ferramentas preditivas.

Tipo de modelo

A ferramenta Pontuação pode avaliar modelos de vários locais:

  • Modelo local: o modelo é extraído do fluxo de trabalho de uma máquina local ou é acessado em um banco de dados.

  • Modelo do Promote: o modelo é armazenado no sistema de gerenciamento de modelos do Promote.

Configurar para modelo local

A ferramenta Pontuação pode ser configurada para modelos acessados por um fluxo de trabalho padrão ou para modelos acessados usando o conjunto In-DB.

Configurar a ferramenta para processamento padrão

Conectar entradas

A ferramenta Pontuação requer duas entradas:

  • O objeto do modelo produzido em uma ferramenta preditiva baseada em R.

  • Um fluxo de dados que contém os campos preditores selecionados na configuração do modelo. Pode ser um fluxo de dados padrão do Alteryx ou um fluxo de metadados XDF.

Conecte essas entradas à entrada da ferramenta Pontuação para iniciar a configuração.

Modelos compatíveis

A ferramenta Pontuação pode usar um fluxo de dados de um modelo preditivo, mesmo que ele tenha sido treinado usando uma função RevoScaleR. A ferramenta Pontuação só pode usar um fluxo de metadados XDF se a entrada para a ferramenta de modelagem foi feita a partir de uma ferramenta Saída XDF ou Entrada XDF e o modelo foi estimado usando uma função RevoScaleR.

Os modelos estimados pelo Oracle R Enterprise usando uma ferramenta preditiva In-DB conectada a uma fonte de dados Oracle não podem ser usados para pontuar um fluxo de dados padrão do Alteryx, embora os modelos estimados com um fluxo de dados padrão do Alteryx possam ser usados para pontuar fontes de dados Oracle.

Configuração

Os ajustes feitos por meio dessa opção só serão válidos se o alvo for uma variável categórica binária.

  • "O novo nome de campo (alvo contínuo) ou prefixo (alvo categórico)": o nome do campo ou o prefixo deve começar com uma letra e pode conter letras, números e os caracteres especiais ponto (".") e sublinhado ("_"). O R diferencia maiúsculas de minúsculas.

  • "O campo-alvo tem um valor superamostrado": esses campos são usados para adequar as probabilidades ajustadas para que correspondam às porcentagens reais da amostra. Selecione para fornecer:

    • "O valor do campo-alvo que foi superamostrado": o nome do campo superamostrado.

    • "A porcentagem do valor superamostrado nos dados originais antes da superamostragem": a porcentagem de valores que foram repetidos durante a superamostragem.

  • Opções somente de regressão linear não regularizada:

    Modelos criados no ORE

    Se estiver usando um modelo criado no ORE, a tabela de estimativa original deverá existir no banco de dados para calcular os intervalos de confiança.

    • "O campo-alvo foi transformado em logaritmo natural": selecione para aplicar uma transformação que ajuste os valores de volta à escala original e para usar um estimador de Smearing para levar em conta o viés de transformação subsequente.

    • "Incluir um intervalo de confiança preditivo": selecione para especificar o valor usado para calcular intervalos de confiança.

  • Opções específicas de entrada XDF:

    • "Acrescentar pontuações ao arquivo de entrada XDF": selecione para acrescentar pontuações ao arquivo de entrada XDF em vez de colocá-las em um fluxo de dados do Alteryx.

  • "O número de registros que devem ser pontuados por vez": selecione o número de registros em um grupo. Os dados de entrada são pontuados um grupo de cada vez para evitar a limitação de processamento na memória do R.

Configurar a ferramenta para processamento no banco de dados

A ferramenta Pontuação oferece suporte ao processamento no banco de dados Oracle, Microsoft SQL Server 2016 e Teradata. Consulte Visão geral do processamento em banco de dados para obter mais informações sobre suporte e ferramentas de banco de dados.

Para acessar a versão In-DB da ferramenta Pontuação:

  • Coloque uma ferramenta In-DB na tela. A ferramenta Pontuação muda automaticamente para a versão In-DB.

  • Clique com o botão direito do mouse na ferramenta Pontuação, aponte para "Escolher versão da ferramenta" e selecione "Versão In-DB".

Consulte Análise preditiva para obter mais informações sobre o suporte à análise preditiva no banco de dados.

Conectar uma entrada

A ferramenta Pontuação requer duas entradas:

  • O objeto do modelo produzido em uma ferramenta preditiva baseada em R.

  • Um fluxo de dados que contém os campos preditores selecionados na configuração do modelo. Pode ser um fluxo de dados padrão do Alteryx ou um fluxo de metadados XDF.

Conecte essas entradas à entrada da ferramenta Pontuação para iniciar a configuração.

Modelos compatíveis

A ferramenta Pontuação pode usar um fluxo de dados de um modelo preditivo, mesmo que ele tenha sido estimado usando uma função RevoScaleR. A ferramenta Pontuação só pode usar um fluxo de metadados XDF se a entrada para a ferramenta de modelagem foi feita a partir de uma ferramenta Saída XDF ou Entrada XDF e o modelo foi estimado usando uma função RevoScaleR.

Os modelos estimados pelo ORE usando uma ferramenta preditiva In-DB conectada a uma fonte de dados Oracle não podem ser usados para pontuar um fluxo de dados padrão do Alteryx, embora os modelos estimados com um fluxo de dados padrão do Alteryx possam ser usados para pontuar fontes de dados Oracle.

Configuração

Nenhum outro caractere especial é permitido, e a ferramenta R diferencia maiúsculas de minúsculas.

  • "Nome da tabela de saída": digite o nome da tabela na qual os resultados serão salvos no banco de dados.

  • "O novo nome de campo (alvo contínuo) ou prefixo (alvo categórico)": o nome do campo ou o prefixo deve começar com uma letra e pode conter letras, números e os caracteres especiais ponto (".") e sublinhado ("_").

  • "O campo-alvo tem um valor superamostrado": esses campos são usados para adequar as probabilidades ajustadas para que correspondam às porcentagens reais da amostra. Os ajustes feitos por meio dessa opção só serão válidos se o alvo for uma variável categórica binária. Selecione para fornecer:

    • "O valor do campo-alvo que foi superamostrado": o nome do campo superamostrado.

    • "A porcentagem do valor superamostrado nos dados originais antes da superamostragem": a porcentagem de valores que foram repetidos durante a superamostragem.

  • Opções somente de regressão linear:

    Modelos criados no ORE

    Se estiver usando um modelo criado no ORE, a tabela de estimativa original deverá existir no banco de dados para calcular os intervalos de confiança.

    • "O campo-alvo foi transformado em logaritmo natural": selecione para aplicar uma transformação que ajuste os valores de volta à escala original e para usar um estimador de Smearing para levar em conta o viés de transformação subsequente.

    • "Incluir um intervalo de confiança preditivo": selecione para especificar o valor usado para calcular intervalos de confiança.

  • Configuração específica do Teradata: o Microsoft Machine Learning Server precisa de informações de configuração adicionais sobre a plataforma Teradata específica a ser usada. Essas informações normalmente são fornecidas por um administrador local do Teradata.

    • Os caminhos do servidor do Teradata para os executáveis binários do R.

    • O local de gravação do arquivo temporário usado pelo Microsoft Machine Learning Server.

Origem do modelo (somente Oracle)

  • "Origem do modelo": selecione a origem do objeto do modelo que é passado para a entrada (M) da ferramenta Pontuação. Isso pode ser:

    • No banco de dados, identificado pelo valor no campo "Nome" do fluxo de dados.

    • Contido no campo "Objeto" do fluxo de dados.

Visualizar a saída

A saída inclui os fluxos de dados originais com os valores previstos do modelo. No caso de um modelo que usa um alvo categórico, uma probabilidade prevista para cada nível da variável-alvo é fornecida em um nome de campo composto pelo prefixo fornecido pelo usuário e o sufixo do campo que corresponde ao nível possível da variável-alvo.

Configurar o modelo do Promote

Promote é uma plataforma para implantar, gerenciar e dimensionar modelos preditivos. O Alteryx pode se conectar à plataforma Promote para acessar modelos armazenados e pontuar em relação a eles.

Credenciais do Promote

  • Estabeleça uma conexão do Alteryx Promote.

  • Conexão do Alteryx Promote: uma lista suspensa usada para selecionar a partir das conexões salvas do Promote.

  • Adicionar conexão: uma opção para adicionar à lista de conexões disponíveis no Promote. O gerenciador de conexão do Promote opera independentemente dos fluxos de trabalho.

Adicionar uma conexão do Promote

  1. Clique em Adicionar conexão.

  2. Na janela "Adicionar conexão", insira um URL do Alteryx Promote, um URL que aponta para o local onde seu modelo está armazenado.

  3. Selecione Próximo.

  4. Na janela "Credenciais do Alteryx Promote", insira seu nome de usuário e chave de API.

  5. Clique em Conectar.

  6. Caso consiga, selecione Concluir na janela Conexão estabelecida. A nova conexão é selecionada e fica visível no menu suspenso.

Excluir uma conexão do Promote

  1. Selecione uma conexão disponível.

  2. Selecione Remover conexão.

  3. Na janela de confirmação, verifique se o URL e o nome de usuário estão associados à conexão que você deseja remover.

  4. Clique em OK. A conexão não está mais disponível na lista suspensa.

Acesso ao Promote

Se você não tiver certeza de que tem acesso ao Promote ou se necessita de assistência para encontrar as credenciais necessárias, entre em contato com seu administrador local ou seu representante de atendimento ao cliente.

Seleção do modelo

Uma lista dos modelos aos quais você tem acesso é gerada. Percorra a lista ou use a função de pesquisa para encontrar o modelo que deseja pontuar e selecione o caminho do modelo.

Depois que um caminho de modelo é selecionado, as informações sobre o modelo são preenchidas.

  • Nome: o nome do modelo.

  • Proprietário: o proprietário do modelo.

  • Status: o estado atual do modelo, refletindo sua acessibilidade.

    • Online: o modelo está atualizado e pronto para processar dados.

    • Em construção: o modelo está sendo atualizado e não pode processar dados.

    • Teste de unidade com falha: o modelo foi concluído, mas os componentes não foram construídos corretamente. O modelo não pode processar dados.

    • Falha: o modelo não foi construído corretamente e não pode processar dados.

    • Offline: o modelo não foi construído e não pode processar dados.

  • Última atualização: o carimbo de data/hora da última construção do modelo.

Verifique se o modelo está disponível para processamento de dados e selecione "Concluído".

Resumo da configuração

A seção "Resumo da configuração" fornece um resumo das credenciais usadas, e a seção "Resumo do modelo" fornece o resumo do modelo selecionado.