Classificação de Texto Zero-shot
A ferramenta Classificação de Texto Zero-shot atribui categorias pontuadas a corpos de texto com base em uma lista de categorias definida por você. Por exemplo, você pode fazer a entrada de artigos de jornal e definir as categorias de rótulo "Política" e "Tecnologia", e a ferramenta fornece uma probabilidade para a relevância de cada rótulo. A ferramenta Classificação de Texto Zero-shot não requer dados de treinamento e aproveita o ONNX Runtime usando o modelo de transformador do Hugging Face .
Requer o Alteryx Intelligence Suite
Esta ferramenta faz parte do Alteryx Intelligence Suite . O Intelligence Suite exige uma licença separada e um instalador complementar para o Designer. Depois de instalar o Designer, instale o Intelligence Suite e inicie sua avaliação gratuita .
Suporte a idiomas
A ferramenta Classificação de Texto Zero-shot só é compatível com o inglês no momento.
Componentes da ferramenta
A ferramenta Classificação de Texto Zero-shot tem três âncoras (duas de entrada e uma de saída):
Âncora de entrada D : use a âncora de entrada D para conectar os dados de texto que você deseja categorizar.
Âncora de entrada L : use a âncora de entrada L para passar rótulos de categoria para a ferramenta.
Âncora de saída: use a âncora de saída para passar as categorias pontuadas de cada corpus textual para etapas posteriores.
Configurar a ferramenta
Adicione uma ferramenta Classificação de Texto Zero-shot à tela.
Use a âncora de entrada D para conectar a ferramenta Classificação de Texto Zero-shot aos dados de texto que você deseja usar no fluxo de trabalho.
Se você tiver grandes corpos de texto, divida o texto em seções menores ou realize pré-processamento com as ferramentas Pré-processamento de Texto ou Resumo de Texto .
Use a âncora de entrada L para passar os rótulos de categoria para a ferramenta Classificação de Texto Zero-shot. Você pode usar a ferramenta Entrada de Texto para criar sua lista de rótulos.
Selecione a Coluna com texto que deseja analisar. A ferramenta não exige dados de treinamento.
Selecione a Coluna com rótulos para as categorias que você deseja pontuar.
(Opcional) Marque a opção Classificação com múltiplos rótulos para tratar categorias de forma independente umas das outras. Use essa opção para determinar se o texto pertence a mais de uma categoria.
Clique no botão para Executar o fluxo de trabalho.
Saída
A saída inclui dois conjuntos de colunas:
Coluna para cada rótulo de categoria. Cada coluna representa o grau em que o texto de cada linha está associado a cada categoria. Um valor mais alto nessa coluna indica uma maior probabilidade de o texto estar associado a essa categoria.
Coluna que contém o rótulo da categoria com maior o valor de probabilidade (se você usar mais de um rótulo).