Fusionner les tables
L'outil Écrire des données en BDD prend en charge l'option Fusionner les tables pour les workflows connectés à Databricks Unity Catalog. Cette option fusionne un ensemble de mises à jour ou de suppressions en fonction des enregistrements entrants (la source) dans une table Delta cible (la cible).
L'outil utilise une instruction MERGE INTO comme décrit dans la documentation Databricks.
Pour configurer l'option Fusionner les tables dans l'outil Écrire des données en BDD, procédez comme suit :
Créez une connexion Databricks Unity Catalog via la boîte de dialogue Gérer les connexions in BDD.
Pour créer les données sources, choisissez l'une des options suivantes :
Connectez un outil Connecter en BDD à la connexion Databricks Unity Catalog et mappez-le à la table qui sera utilisée comme données sources pour l'option Fusionner les tables.
Utilisez un outil Entrée du flux de données pour importer des données d'un ensemble de données externe dans Databricks afin de les utiliser comme données sources.
Connectez un outil Écrire des données en BDD au workflow et sélectionnez l'option Fusionner les tables comme mode de sortie.
L'option Fusionner les tables n'est disponible que si l'outil peut détecter une connexion Databricks Unity Catalog.
Saisissez le nom de la table cible. Il s'agit de la table en cours de modification. La table doit être une table Delta.
Sélectionnez Appliquer pour enregistrer le nom de la table cible et mettre à jour les champs de fusion.
Choisissez les champs de fusion dans la liste déroulante. Au moins un ensemble de champs de fusion doit être sélectionné.
Sélectionnez l'action de correspondance.
Supprimer : supprimez toutes les lignes de table correspondantes dans la table cible.
Mettre à jour : mettez à jour la ligne de la table cible correspondante avec les données sources.
Configuration automatique par nom : mappez automatiquement les champs des données sources à la table cible. Les champs supplémentaires dans les données sources sont ignorés. Les champs manquants entraînent l'échec du workflow.
Personnaliser : faites correspondre manuellement les champs des données sources à la table cible. Tous les champs doivent être mappés. Les champs cible ne peuvent pas être définis sur
[aucun]
. Les champs manquants entraînent l'échec du workflow.