Unisci tabelle
Lo strumento Scrivi dati In-DB supporta Unisci tabelle per i flussi di lavoro collegati a Databricks Unity Catalog. Questa opzione consente di unire una serie di aggiornamenti o eliminazioni in base ai record in entrata ( origine ) in una tabella Delta di destinazione ( destinazione ).
Utilizza un'istruzione MERGE INTO come descritto nella documentazione di Databricks .
Per configurare Unisci tabelle nello strumento Scrivi dati In-DB:
Crea una connessione a Databricks Unity Catalog tramite la finestra di dialogo Gestisci connessioni In-DB.
Per creare i dati di origine, scegli una di queste opzioni:
Collega uno strumento Connetti In-DB alla connessione a Databricks Unity Catalog e associalo alla tabella che verrà utilizzata come dati di origine per Unisci tabelle.
Utilizza uno strumento Flusso di dati in entrata per trasferire i dati da un set di dati esterno nel Databricks da utilizzare come dati di origine.
Collega uno strumento Scrivi dati In-DB al flusso di lavoro e seleziona Unisci tabelle come Modalità di output.
Unisci tabelle è disponibile solo se lo strumento è in grado di rilevare una connessione a Databricks Unity Catalog.
Immetti il nome della tabella di destinazione . Si tratta della tabella interessata dalla modifica. La tabella deve essere di tipo Delta.
Seleziona Applica per salvare il nome della tabella di destinazione e aggiornare i campi di unione.
Scegli i campi di unione dal menu a discesa. È necessario selezionare almeno un set di campi di unione.
Seleziona Azione di corrispondenza .
Elimina : consente di eliminare tutte le righe corrispondenti nella tabella di destinazione.
Aggiorna : consente di aggiornare la riga della tabella di destinazione corrispondente con i dati di origine.
Configurazione automatica per nome : consente di mappare automaticamente i campi dai dati di origine alla tabella di destinazione. I campi aggiuntivi nei dati di origine vengono ignorati. L'assenza di alcuni campi impedisce l'esecuzione del flusso di lavoro.
Personalizza : consente di associare manualmente i campi dai dati di origine alla tabella di destinazione. Tutti i campi devono essere mappati e quelli di destinazione non possono essere
[nessuno]
. L'assenza di alcuni campi impedisce l'esecuzione del flusso di lavoro.