Ferramenta Correspondência de Precisão
Função de usuário
Função de usuário* | Disponibilidade da ferramenta |
---|---|
Usuário completo (requer add-on) | ✓ |
Usuário básico | X |
*Aplica-se a clientes do Alteryx One Professional Edition e Enterprise Edition nas versões 2025.1 e posteriores do Designer.
A ferramenta Correspondência de Precisão executa operações semelhantes à correspondência parcial em dados de cadeia de caracteres (string) para padronizar diferentes variações da mesma frase em um único valor. Use a ferramenta Correspondência de Precisão quando seus dados contiverem múltiplas grafias da mesma frase (por exemplo, color e colour ou US e United States).
Nota
As ferramentas de IA generativa estão atualmente em versão prévia pública. Saiba como participar da versão prévia pública e comece a usar fluxos de trabalho com a tecnologia de IA!
Componentes da ferramenta
A ferramenta Correspondência de Precisão tem cinco âncoras (três de entrada e duas de saída):
Âncora de entrada M: use a âncora de entrada M para conectar as configurações de conexão do modelo da ferramenta Substituição de LLM.
Âncora de entrada D: use a âncora de entrada D para conectar os dados de cadeia de caracteres (string) que você deseja padronizar.
Âncora de entrada R (opcional): use a âncora de entrada R para se conectar a um conjunto de dados de referência que contenha frases padronizadas que você gostaria que o LLM usasse.
Âncora de saída D: use a âncora de saída D para passar os dados de entrada correspondentes para as próximas etapas.
Âncora de saída M: use a âncora de saída M para passar a tabela de mapeamento gerada pelo LLM para as próximas etapas.
Configurar a ferramenta
Adicione a ferramenta Correspondência de Precisão à tela.
Conecte a âncora de entrada D aos dados de cadeia de caracteres (string) categóricos que você deseja usar no seu fluxo de trabalho. Observe que a ferramenta Correspondência de Precisão destina-se apenas a dados categóricos (por exemplo, nomes ou locais).
(Opcional) Conecte a âncora de entrada R a um conjunto de dados de referência que contenha uma lista de frases padronizadas. Use essa âncora se você tiver preferência pelas frases padronizadas desejadas. Caso contrário, o LLM toma sua própria decisão com base em sua criação de prompts interna.
Conecte a âncora de entrada M a uma ferramenta Substituição por LLM.
Selecione a coluna que contém os dados que você deseja padronizar no menu suspenso Escolher campo.
Na seção Como deseja que os resultados sejam enviados para a saída?, você pode selecionar…
Substituir a coluna selecionada: substitua a coluna selecionada pelas frases padronizadas.
Adicionar como uma nova coluna: cria uma nova coluna no conjunto de dados com as frases padronizadas. (Opcional) Insira um nome para a nova coluna.
(Opcional) Se os dados de entrada não tiverem sido alterados e você quiser usar uma tabela de mapeamento em cache, marque a caixa de seleção Usar tabela de mapeamento em cache?. Use essa opção para salvar solicitações de LLM ao trabalhar em outras partes do seu fluxo de trabalho.
(Opcional) Se o seu fluxo de trabalho tiver uma entrada dinâmica e você quiser evitar solicitações de LLM potencialmente altas, você poderá definir um limite de contagem de linhas que faça com que o seu fluxo de trabalho pare com um erro. Insira um limite de linhas no parâmetro Erro se o número de categorias exceder o valor.
Execute o fluxo de trabalho.
Saída
A ferramenta Correspondência de Precisão tem duas âncoras de saída que passam as frases padronizadas para etapas posteriores de duas maneiras:
A âncora de saída D inclui seus dados de entrada correspondentes para etapas posteriores. Dependendo de qual opção você seleciona na seção Como deseja que os resultados sejam enviados para a saída?, a âncora de saída D executa uma destas duas ações…
Atualiza a coluna de cadeia de caracteres (string) selecionada com frases padronizadas quando você seleciona Substituir a coluna selecionada.
Acrescenta frases padronizadas aos dados quando você seleciona Adicionar como uma nova coluna.
A âncora de saída M inclui a tabela de mapeamento do LLM usada para padronizar seus dados. A tabela de mapeamento inclui uma coluna para o valor original e outra para o valor padronizado da cadeia de caracteres (string).