Mesclar tabelas
A ferramenta Gravar Dados In-DB é compatível com a mesclagem de tabelas para fluxos de trabalho conectados ao Unity Catalog do Databricks. Essa opção mescla um conjunto de atualizações ou exclusões com base nos registros de entrada (a origem ) em uma tabela Delta de destino (o alvo ).
Ela usa uma instrução MERGE INTO, conforme descrito na documentação do Databricks .
Para configurar a funcionalidade "Mesclar tabelas" na ferramenta Gravar Dados In-DB:
Crie uma conexão com o Unity Catalog do Databricks através da caixa de diálogo "Gerenciar conexões in-DB".
Para criar os dados de origem, escolha uma destas opções:
Conecte uma ferramenta Conectar In-DB ao Unity Catalog do Databricks e faça o mapeamento para a tabela que será usada como os dados de origem na funcionalidade "Mesclar Tabelas".
Use uma ferramenta Entrada do Fluxo de Dados para trazer dados de um conjunto externo para o Databricks para serem usados como os dados de origem.
Conecte uma ferramenta Gravar Dados In-DB ao fluxo de trabalho e selecione Mesclar tabelas como o modo de saída.
A opção "Mesclar Tabelas" só estará disponível se a ferramenta puder detectar uma conexão ao Unity Catalog do Databricks.
Insira o Nome da tabela-alvo . Esta é a tabela que está sendo modificada. A tabela deve ser uma tabela Delta.
Clique em Aplicar para salvar o nome da tabela-alvo e atualizar os campos de mescla.
Escolha os Campos de mescla no menu suspenso. Pelo menos um conjunto de campos de mescla deve ser selecionado.
Selecione a Ação para correspondência
Excluir : exclua todas as linhas que apresentam correspondência na tabela-alvo.
Atualizar : atualize as linhas da tabela-alvo que apresentam correspondência com os dados da origem.
Configurar automaticamente por nome : mapeie os campos automaticamente, dos dados de origem à tabela-alvo. Campos extra nos dados de origem são ignorados. Campos ausentes causam falha no fluxo de trabalho.
Personalizado : faça a correspondência dos campos manualmente, dos dados de origem à tabela-alvo. Todos os campos devem ser mapeados; os campos-alvo não podem ser
[nenhum]
. Campos ausentes causam falha no fluxo de trabalho.