Skip to main content

合并表格

库内写入数据工具支持连接到 Databricks Unity Catalog 的工作流的合并表格。此选项根据传入记录()将一组更新或删除合并到目标 Delta 表格(目标)中。

它使用 Databricks 文档中所述的 MERGE INTO 语句。

要在库内写入数据工具中配置合并表格:

  1. 通过“管理库内连接”对话框,创建 Databricks Unity Catalog 连接。

  2. 要创建源数据,请选择以下选项之一:

    • 库内连接工具连接到 Databricks Unity Catalog 连接,并将其映射到将用作合并表格源数据的表格中。

    • 或者使用数据流传入工具,将外部数据集中的数据导入 Databricks 以用作源数据。

  3. 库内写入数据工具连接到工作流,然后选择合并表格作为输出模式。

    • 合并表格只有在工具能检测到 Databricks Unity Catalog 连接时才可用。

  4. 输入目标表格名称。这是要修改的表格。该表格必须是 Delta 表格。

  5. 选择应用以保存目标表格名称并更新合并字段。

  6. 从下拉列表中选择合并字段。必须至少选择一组合并字段。

  7. 选择匹配操作

    • 删除:删除目标表格中所有匹配的表格行。

    • 更新:使用源数据更新匹配的目标表格内的行。

      • 按名称自动配置:自动将源数据中的字段映射到目标表格。源数据中的额外字段将被忽略。缺失字段会导致工作流失败。

      • 自定义:手动将源数据中的字段与目标表格匹配。必须映射所有字段,目标字段不能为 [无]。缺失字段会导致工作流失败。