Skip to main content

Unisci tabelle

Lo strumento Scrivi dati In-DB supporta Unisci tabelle per i flussi di lavoro collegati a Databricks Unity Catalog. Questa opzione consente di unire una serie di aggiornamenti o eliminazioni in base ai record in entrata ( origine ) in una tabella Delta di destinazione ( destinazione ).

Utilizza un'istruzione MERGE INTO come descritto nella documentazione di Databricks .

Per configurare Unisci tabelle nello strumento Scrivi dati In-DB:

  1. Crea una connessione a Databricks Unity Catalog tramite la finestra di dialogo Gestisci connessioni In-DB.

  2. Per creare i dati di origine, scegli una di queste opzioni:

    • Collega uno strumento Connetti In-DB alla connessione a Databricks Unity Catalog e associalo alla tabella che verrà utilizzata come dati di origine per Unisci tabelle.

    • Utilizza uno strumento Flusso di dati in entrata per trasferire i dati da un set di dati esterno nel Databricks da utilizzare come dati di origine.

  3. Collega uno strumento Scrivi dati In-DB al flusso di lavoro e seleziona Unisci tabelle come Modalità di output.

  4. Immetti il nome della tabella di destinazione . Si tratta della tabella interessata dalla modifica. La tabella deve essere di tipo Delta.

  5. Seleziona Applica per salvare il nome della tabella di destinazione e aggiornare i campi di unione.

  6. Scegli i campi di unione dal menu a discesa. È necessario selezionare almeno un set di campi di unione.

  7. Seleziona Azione di corrispondenza .

    • Elimina : consente di eliminare tutte le righe corrispondenti nella tabella di destinazione.

    • Aggiorna : consente di aggiornare la riga della tabella di destinazione corrispondente con i dati di origine.

      • Configurazione automatica per nome : consente di mappare automaticamente i campi dai dati di origine alla tabella di destinazione. I campi aggiuntivi nei dati di origine vengono ignorati. L'assenza di alcuni campi impedisce l'esecuzione del flusso di lavoro.

      • Personalizza : consente di associare manualmente i campi dai dati di origine alla tabella di destinazione. Tutti i campi devono essere mappati e quelli di destinazione non possono essere [nessuno] . L'assenza di alcuni campi impedisce l'esecuzione del flusso di lavoro.