Ferramenta Junção
Fluxo de trabalho de exemplo
A ferramenta Junção tem um fluxo de trabalho de exemplo. Visite Exemplos de fluxos de trabalho para saber como acessar esse e muitos outros exemplos diretamente do Alteryx Designer.
Use a ferramenta Junção para combinar duas entradas com base em campos comuns entre as duas tabelas. Você também pode combinar dois fluxos de dados com base na posição dos registros.
Configurar a ferramenta
Selecione como executar a junção. As duas opções são: pela posição dos registros ou por um campo (coluna) específico.
Junção pela posição dos registros : selecione essa opção quando as duas tabelas a serem combinadas têm a mesma estrutura de campos; os dados são combinados com base em suas posições dentro das duas tabelas.
Junção por campos específicos : selecione essa opção quando as duas tabelas têm um ou mais campos em comum (como um ID); os dados são combinados com base no campo compartilhado. Você pode optar por executar a junção com base em múltiplos campos. Cada junção deve ser uma linha separada na grade.
Mensagens de erro potenciais
A ferramenta Junção restringe quais tipos de campo podem ser combinados. Estes avisos ou erros podem ocorrer:
Campos de cadeia de caracteres só podem ser combinados a outros campos de cadeia de caracteres.
Campos numéricos só podem ser combinados a outros campos numéricos.
Campos do tipo Double só podem ser combinados a outros campos desse mesmo tipo.
Junções em dados Double ou Float não são recomendadas devido a erros de arredondamento.
Campos booleanos só podem ser combinados a outros campos booleanos.
Campos de data/hora só podem ser combinados a outros campos que tenham exatamente o mesmo tipo de dados.
Campos espaciais não podem ser combinados. Use a ferramenta Correspondência Geográfica para isso.
Campos do tipo Blob não podem ser combinados a nenhum outro tipo.
Cada entrada ( Esquerda e Direita ) possui uma lista suspensa onde você pode selecionar campos (colunas). Selecione o campo de junção para cada entrada. O Alteryx Designer seleciona automaticamente o campo de junção para uma entrada se um campo com o mesmo nome já foi selecionado para a outra entrada. Se você precisar de múltiplos campos de junção, pode configurar uma linha adicional de campos de junção.
Clique no menu suspenso para escolher um campo de junção adicional para cada entrada.
Para excluir um campo de junção, clique no número do lado esquerdo e selecione o botão Excluir .
Use a tabela na janela Configuração para modificar o fluxo de dados de entrada. Cada linha na tabela representa uma coluna nos dados. A coluna Campo na tabela identifica o nome de cada coluna nos dados e se ajusta automaticamente para acomodar os nomes das colunas (campos) sem cortar nenhum texto (até 40 caracteres).
Pesquisar colunas
Antes de começar a atualizar suas colunas (campos), é possível limitar sua lista para poder executar atualizações somente em um subconjunto das colunas. Isso também é muito útil se o conjunto de dados contiver muitas colunas.
Para fazer isso, você pode usar a caixa Pesquisar na parte superior da janela Configuração . Insira uma palavra-chave e a ferramenta Junção pesquisará as colunas Coluna , Renomear e Descrição para retornar correspondências. A pesquisa não diferencia maiúsculas de minúsculas.
Em seguida, você pode executar várias ações (como selecionar, desmarcar, renomear etc.) somente nas colunas que foram retornadas por meio da pesquisa. Pense na caixa "Pesquisar" como uma maneira de filtrar sua lista de colunas para que você possa atualizar apenas um subconjunto de seus dados.
Para exibir novamente toda a lista de colunas, use o ícone "x" para limpar a caixa Pesquisar .
Nota
Depois de realizar uma pesquisa, somente um subconjunto de suas colunas (campos) de dados será exibido. Observe que, dependendo da ação escolhida no menu Opções ...
Algumas ações podem se aplicar somente às colunas sendo mostradas.
Algumas ações podem se aplicar a todas as colunas, independentemente de quais estão sendo mostradas.
Algumas ações podem se aplicar somente às colunas específicas selecionadas (destacadas) na lista de colunas.
Por isso, tenha cuidado ao executar ações em um subconjunto de colunas e verifique os resultados para garantir que eles sejam o que você espera.
Selecionar, desmarcar, ordenar e reordenar colunas
Selecionar e desmarcar colunas/campos
Para incluir uma coluna no conjunto de dados, marque a caixa de seleção à esquerda do nome da coluna. Desmarque a caixa de seleção para excluir a coluna. Você também pode usar a caixa de seleção na parte superior da tabela para rapidamente selecionar e desmarcar todas as colunas visíveis.
Ordenar colunas
Para ordenar as colunas de dados com base no nome da coluna...
Clique no nome da coluna para classificar em ordem crescente.
Clique no nome da coluna uma segunda vez para classificar em ordem decrescente.
Método de ordenação
A ordem de classificação padrão depende do idioma em que você está usando o Designer. Consulte Configurações de idioma e região para saber mais sobre o Método de ordenação padrão.
Reordenar colunas
Para reordenar as colunas de dados...
Clique para realçar uma linha ou clique e arraste para realçar múltiplas linhas.
Use as setas Mover para cima ou Mover para baixo ou clique com o botão direito do mouse e arraste para mover as linhas para um novo local.
A coluna Unknown é selecionada por padrão. Isso permite novas colunas nos dados. Mova essa coluna para o local onde você deseja que uma nova coluna seja inserida.
Modificar o tipo e o tamanho dos dados
Tipo de dados
Use a lista suspensa Tipo para alterar o tipo de dados de uma coluna em seu conjunto de dados.
Tamanho dos dados
Para alterar o comprimento (caracteres para todos os tipos String, DateTime, Time e FixedDecimal) ou a medida (bytes para os outros tipos numéricos) permitidos para os dados em uma coluna, clique em Tamanho e digite um número. O tamanho varia de acordo com o tipo de dados e pode ser editado para os tipos numéricos decimais fixos, tipos de data/hora e hora e todos os tipos de cadeia de caracteres.
Use a opção [tipo de dados]: Forçado para garantir que uma coluna sempre contenha o tipo esperado de dados. Isso é útil ao criar macros .
Renomear uma coluna ou adicionar uma descrição
Para alterar o nome de uma coluna, selecione o campo Renomear e insira o novo nome.
Para adicionar uma descrição, selecione o campo Descrição e insira uma descrição.
Exibir mais opções
Depois de selecionar ou destacar linhas (colunas de dados) na tabela, clique no menu suspenso Opções acima da tabela para exibir mais opções de configuração:
Salvar/Carregar : salve a configuração das colunas como um arquivo .yxft. O arquivo de tipos de campo do Alteryx é um arquivo de texto que pode ser usado em outros fluxos de trabalho por meio das opções Carregar nomes de colunas ou Carregar nomes e tipos de colunas .
Selecionar : marque ou desmarque todas as colunas ou as colunas realçadas. As opções incluem Selecionar tudo e Desmarcar tudo .
Alterar o tipo de coluna das colunas destacadas : altere o tipo de dados de todas as colunas realçadas.
Ordenar : classifique a ordem das colunas em crescente ou decrescente. As opções incluem Ordenar pelo nome das colunas , Ordenar pelo novo nome das colunas e Ordenar pelo tipo das colunas ou Reverter para a ordem de entrada das colunas . A ordem de classificação padrão depende do idioma em que você está usando o Designer. Consulte Configurações de idioma e região para saber mais sobre o Método de ordenação padrão.
Mover : mova as colunas realçadas para a parte superior ou inferior da lista.
Adicionar prefixo ao nome das colunas : adicione um prefixo ao nome da coluna selecionada ou realçada.
Adicionar sufixo ao nome das colunas : adicione um sufixo ao nome da coluna selecionada ou realçada.
Remover prefixo ou sufixo : remova o prefixo ou o sufixo do nome da coluna selecionada ou realçada.
Limpar todas as renomeações : remova o novo nome de todas as colunas.
Limpar renomeações destacadas : remova o novo nome de todas as colunas realçadas.
Reverter tudo para o tipo e tamanho originais : desfaça todas as alterações de tipo e tamanho em todas as colunas e use os valores originais.
Reverter destacados para o tipo e tamanho originais : desfaça alterações de tipo e tamanho nas colunas selecionadas ou realçadas e use os valores originais.
Esquecer todas as colunas ausentes : remova todas as colunas que não estão mais incluídas nos dados.
Esquecer colunas ausentes destacadas : remova todas as colunas realçadas que não estão mais incluídas nos dados.
Desmarcar colunas duplicadas : desmarque a segunda coluna quando existirem nomes de coluna duplicados. Essa opção só está disponível com múltiplas entradas.
Visualizar a saída
As três saídas resultantes da junção são...
Âncora L | Contém os registros da entrada L que não foram combinados aos registros da entrada R. | |
Âncora J | Contém os registros que foram combinados entre as entradas L e R. | |
Âncora R | Contém os registros da entrada R que não foram combinados aos registros da entrada L. |
Tipos adicionais de junções
Consulte a tabela abaixo para usar a ferramenta Junção para executar diferentes tipos de junções.
Inner Join: Contains records that joined from the L input to those records in the R input. | The J output of the Join tool contains the result of an Inner Join. | ||
Left Unjoin: Contains records from the L input that did NOT join to records from the R input. | The L output of the Join tool contains the result of a Left Unjoin. | ||
Right Unjoin: Contains records from the R input that did NOT join to records from the L input. | The R output of the Join tool contains the result of a Right Unjoin. | ||
Left Outer Join: All records from the L input including the records that joined with the R input. | To do a Left Outer Join, connect the J and L outputs of the Join tool to the Union tool. Connect the J output first to establish the combined table schema. | ||
Right Outer Join: All records from the R input including the records that joined with the L input. | To do a Right Outer Join, connect the J and R outputs of the Join tool to the Union tool. Connect the J output first to establish the combined table schema. | ||
Full Outer Join: All of the records from both L and R inputs. | To do a Full Outer Join, connect the J, L, and R outputs of the Join tool to the Union tool. Connect the J output first to establish the combined table schema. |