Skip to main content

Mesclar tabelas

A ferramenta Gravar Dados In-DB é compatível com a mesclagem de tabelas para fluxos de trabalho conectados ao Unity Catalog do Databricks. Essa opção mescla um conjunto de atualizações ou exclusões com base nos registros de entrada (a origem) em uma tabela Delta de destino (o alvo).

Ela usa uma instrução MERGE INTO, conforme descrito na documentação do Databricks.

Para configurar a funcionalidade "Mesclar tabelas" na ferramenta Gravar Dados In-DB:

  1. Crie uma conexão com o Unity Catalog do Databricks através da caixa de diálogo "Gerenciar conexões in-DB".

  2. Para criar os dados de origem, escolha uma destas opções:

    • Conecte uma ferramenta Conectar In-DB ao Unity Catalog do Databricks e faça o mapeamento para a tabela que será usada como os dados de origem na funcionalidade "Mesclar Tabelas".

    • Use uma ferramenta Entrada do Fluxo de Dados para trazer dados de um conjunto externo para o Databricks para serem usados como os dados de origem.

  3. Conecte uma ferramenta Gravar Dados In-DB ao fluxo de trabalho e selecione Mesclar tabelas como o modo de saída.

    • A opção "Mesclar Tabelas" só estará disponível se a ferramenta puder detectar uma conexão ao Unity Catalog do Databricks.

  4. Insira o Nome da tabela-alvo. Esta é a tabela que está sendo modificada. A tabela deve ser uma tabela Delta.

  5. Clique em Aplicar para salvar o nome da tabela-alvo e atualizar os campos de mescla.

  6. Escolha os Campos de mescla no menu suspenso. Pelo menos um conjunto de campos de mescla deve ser selecionado.

  7. Selecione a Ação para correspondência

    • Excluir: exclua todas as linhas que apresentam correspondência na tabela-alvo.

    • Atualizar: atualize as linhas da tabela-alvo que apresentam correspondência com os dados da origem.

      • Configurar automaticamente por nome: mapeie os campos automaticamente, dos dados de origem à tabela-alvo. Campos extra nos dados de origem são ignorados. Campos ausentes causam falha no fluxo de trabalho.

      • Personalizado: faça a correspondência dos campos manualmente, dos dados de origem à tabela-alvo. Todos os campos devem ser mapeados; os campos-alvo não podem ser [nenhum]. Campos ausentes causam falha no fluxo de trabalho.