Unisci tabelle
Lo strumento Scrivi dati In-DB supporta Unisci tabelle per i flussi di lavoro collegati a Databricks Unity Catalog. Questa opzione consente di unire una serie di aggiornamenti o eliminazioni in base ai record in entrata (origine) in una tabella Delta di destinazione (destinazione).
Utilizza un'istruzione MERGE INTO come descritto nella documentazione di Databricks.
Per configurare Unisci tabelle nello strumento Scrivi dati In-DB:
Crea una connessione a Databricks Unity Catalog tramite la finestra di dialogo Gestisci connessioni In-DB.
Per creare i dati di origine, scegli 1 di queste opzioni:
Collega uno strumento Connetti In-DB alla connessione a Databricks Unity Catalog e associalo alla tabella che verrà utilizzata come dati di origine per Unisci tabelle.
Utilizza uno strumento Flusso di dati in entrata per trasferire i dati da un set di dati esterno nel Databricks da utilizzare come dati di origine.
Collega uno strumento Scrivi dati In-DB al flusso di lavoro e seleziona Unisci tabelle come Modalità di output.
Unisci tabelle è disponibile solo se lo strumento è in grado di rilevare una connessione a Databricks Unity Catalog.
Immetti il nome della tabella di destinazione. Si tratta della tabella interessata dalla modifica. La tabella deve essere di tipo Delta.
Seleziona Applica per salvare il nome della tabella di destinazione e aggiornare i campi di unione.
Scegli i campi di unione dal menu a discesa. È necessario selezionare almeno un set di campi di unione.
Seleziona Azione di corrispondenza.
Elimina: consente di eliminare tutte le righe corrispondenti nella tabella di destinazione.
Aggiorna: consente di aggiornare la riga della tabella di destinazione corrispondente con i dati di origine.
Configurazione automatica per nome: consente di mappare automaticamente i campi dai dati di origine alla tabella di destinazione. I campi aggiuntivi nei dati di origine vengono ignorati. L'assenza di alcuni campi impedisce l'esecuzione del flusso di lavoro.
Personalizza: consente di associare manualmente i campi dai dati di origine alla tabella di destinazione. Tutti i campi devono essere mappati e quelli di destinazione non possono essere
[nessuno]
. L'assenza di alcuni campi impedisce l'esecuzione del flusso di lavoro.