Skip to main content

Gray icon with file graphic inside Microsoft Azure Data Lake 文件输出工具

使用 Azure Data Lake (ADL) 文件输出工具将 Alteryx 工作流中的数据写入 Azure Data Lake Store (ADLS) 中的文件。支持的文件格式包括 CSV、XLSX、JSON 或 Avro(“附加”操作仅支持 CSV 格式)。

重要

此工具不会随 Alteryx Designer 自动安装。要使用此工具,请从 Alteryx Marketplace 下载。

身份验证方法

要登录 Azure Data Lake Store,您需要指定要连接的存储类型。如果您不确定使用的存储类型,可以询问 Azure 管理员或在 Microsoft Azure 门户上检查。

“终端用户(基本)”身份验证类型

此方法只能用于公共 Azure 云。要连接到国家云或自定义 URL,请使用“终端用户(高级)”方法。

您需要 Azure 管理员的帮助,以在您组织的 Azure 租户中允许公共 Alteryx 应用程序。描述这些步骤的 Microsoft 文档可在在 Microsoft Azure 门户上构建 URL 以授予租户范围内的管理员同意中找到。

租户:Gen1 Alteryx 应用程序的通用 ADLS 客户端 ID:

Gen2 Alteryx 应用程序的 ADLS 客户端 ID:2584cace-63ff-47cb-96d2-d153704f4d75

完成此设置后,您可以使用正常的 Microsoft 凭证访问 ADLS 数据。

要登录,只需选择连接,然后输入您的 Microsoft 凭证以访问 ADLS 数据。

“终端用户(高级)”身份验证类型

高级终端用户身份验证支持单租户和多租户身份验证,可用于公共和私有应用程序。Azure 门户中的凭证设置。

  1. 选择身份验证授权端点,或通过填写端点 URL(以 http:// 或 https:// 开头)设置自定义端点。

  2. 填写租户(目录)ID - Azure Active Directory 实例的唯一标识符。此标识符控制 ADLS 所属的 Azure 订阅。如需详细了解如何查找租户 ID,请参阅 Microsoft Azure 文档中的获取租户 ID。对于公共应用程序,您可以使用“common”。

  3. 客户端(应用程序)ID

  4. 对于私有应用程序,必须提供客户端密钥

    注意

    对于 2020.3 之前的 Designer 版本,将显示重定向 URI 字段,并将预填充此字段。在正常使用模式下无需进一步配置。

  5. 选择连接

服务到服务身份验证类型

“服务到服务”身份验证适用于在 Server 和 Hub 上发布工作流。有关凭证设置,请参阅 Azure 门户上的说明。

  1. 选择身份验证授权端点,或通过填写端点 URL(以 http:// 或 https:// 开头)设置自定义端点。

  2. 填写租户(目录)ID - Azure Active Directory 实例的唯一标识符。此标识符控制 ADLS 所属的 Azure 订阅。如需详细了解如何查找租户 ID,请参阅 Microsoft Azure 文档中的获取租户 ID

  3. 客户端(应用程序)ID

  4. 对于私有应用程序,必须提供客户端密钥

  5. 选择连接

共享密钥身份验证类型

“共享密钥”身份验证只能与 Gen2 存储一起使用。对于 Azure 存储账户,Microsoft 将生成两个访问密钥,可用于通过“共享密钥”授权对 Azure Data Lake 的访问。您可以在 Azure 门户中找到有关共享密钥及其用法的更多信息。

  1. 选择存储端点,或者通过填写自定义存储端点来设置自定义端点。

  2. 填写存储账户名称 - 为您的存储提供的唯一名称。

  3. 输入存储账户密钥 - 授权访问的访问密钥。

  4. 选择连接

工具配置

数据选项卡中,可以指定要使用的数据:

  1. 指定存储账户名称。此存储需要与“身份验证”页面上选择的类型相同(分别为 Gen1 和 Gen2)。

  2. 对于 Gen2 存储,请选择文件系统名称

  3. 选择 Gen2 的存储和文件系统后,您可以配置要写入的文件的路径。您可以通过直接输入文件路径字段或使用文件浏览器指定路径,您可以使用相同的机制创建新文件。

  4. 对于 Excel 文件,可以在文件浏览器下的工作表字段中指定工作表名称。如果留空,则自动选择第一个工作表。如果是新文件,工作表将被分配默认名称“Sheet”。

选项选项卡中,您可以设置输出选项(以下选项特定于使用的某些扩展):

  • 文件格式(支持的文件格式包括 CSV、XLSX、JSON 或 Avro)

  • 代码页 - 输出字符编码。

  • 现有文件处理方式(仅 CSV 格式支持附加操作)

  • 上传块大小 - 输入一个值以优化上传速度和内存消耗。

  • 缓冲区大小 - 允许的值为 1 到 256MB。推荐值为 16MB。