Skip to main content

合并表格

库内写入数据 工具支持连接到 Databricks Unity Catalog 的工作流的合并表ge。此选项根据传入记录( )将一组更新或删除合并到目标 Delta 表格( 目标 )中。Blue icon with floppy disk. 库内写入数据工具

它使用 Databricks 文档 中所述的 MERGE INTO 语句。

要在库内写入数据工具中配置合并表格:

  1. 通过“管理库内连接”对话框,创建 Databricks Unity Catalog 连接。

  2. 要创建源数据,请从以下选项中选择一项:

    • 库内连接工具 连接到 Databricks Unity Catalog 连接,并将其映射到将用作合并表格源数据的表格中。

    • 或者使用 数据流传入工具 ,将外部数据集中的数据导入 Databricks 以用作源数据。

  3. 库内写入数据工具 连接到工作流,然后选择 合并表格 作为输出模式。Blue icon with floppy disk. 库内写入数据工具

  4. 输入 目标表格名称 。这是要修改的表格。该表格必须是 Delta 表格。

  5. 选择 应用 以保存目标表格名称并更新合并字段。

  6. 从下拉列表中选择 合并字段 。必须至少选择一组合并字段。

  7. 选择 匹配操作

    • 删除 :删除目标表格中所有匹配的表格行。

    • 更新 :使用源数据更新匹配的目标表格内的行。

      • 按名称自动配置 :自动将源数据中的字段映射到目标表格。源数据中的额外字段将被忽略。缺失字段会导致工作流失败。

      • 自定义 :手动将源数据中的字段与目标表格匹配。必须映射所有字段,目标字段不能为 [无] 。缺失字段会导致工作流失败。