Combinar tablas
La herramienta Escribir datos En-BD admite combinar tablas para flujos de trabajo conectados a Databricks Unity Catalog. Esta opción combina un conjunto de actualizaciones o eliminaciones basadas en los registros entrantes (el origen ) en una tabla delta objetivo (el objetivo ).
Utiliza una instrucción MERGE INTO como se describe en la documentación de Databricks .
Para configurar la funcionalidad "Combinar tablas" en la herramienta Escribir datos En-BD:
Crea una conexión con Databricks Unity Catalog desde el dialogo "Administrar conexiones en-BD".
Para crear los Datos de origen, elige una de estas opciones:
Conecta una herramienta Conexión En-BD a la conexión de Databricks Unity Catalog y asígnala a la tabla que se usará como datos de origen para combinar tablas.
Utiliza una herramienta Entrada de flujo de datos para traer datos de un conjunto de datos externo a Databricks y usarlos como datos de origen.
Conecta una herramienta Escribir datos En-BD al flujo de trabajo y selecciona Combinar tablas como el modo de salida.
La funcionalidad "Combinar tablas" solo está disponible si la herramienta puede detectar una conexión de Databricks Unity Catalog.
Ingresa el Nombre de la tabla objetivo . Esta es la tabla que se va a modificar. La tabla debe ser de tipo delta.
Selecciona Aplicar para guardar el nombre de la tabla objetivo y actualizar combinar campos.
Elige Combinar campos en el menú desplegable. Se debe seleccionar al menos un conjunto de Combinar campos.
Selecciona Acción para coincidencia .
Eliminar : elimina todas las filas de tablas coincidentes en la tabla objetivo.
Actualizar : actualiza la fila de Tabla objetivo coincidente con los datos de origen.
Configurar automáticamente por nombre : asigna automáticamente los campos de datos de origen a la tabla objetivo. Los campos adicionales en los datos de origen se ignoran. Los campos ausentes hacen que el flujo de trabajo falle.
Personalizado : hace coincidir manualmente los campos de los datos de origen con la tabla objetivo. Todos los campos deben estar asignados, los campos objetivo no pueden ser
[none]
. Los campos ausentes hacen que el flujo de trabajo falle.