Skip to main content

Gray icon with file folder Microsoft Azure 数据湖文件输入工具

使用 Azure 数据湖 (ADL) 文件输入工具将数据从 Azure Data Lake Store (ADLS) 中的文件读取到 Alteryx 工作流。支持的文件格式包括 CSV、XLSX、JSON 或 Avro。

重要

此工具不会随 Alteryx Designer 自动安装。要使用此工具,请从 Alteryx Marketplace 下载。

身份验证方法

要登录 Azure Data Lake Store,您需要指定要连接的存储类型。如果您不确定使用的存储类型,可以询问 Azure 管理员或在 Microsoft Azure 门户 上检查。

“终端用户(基本)”身份验证类型

此方法只能用于公共 Azure 云。要连接到国家云或自定义 URL,请使用“终端用户(高级)”方法。

您需要 Azure 管理员的帮助,以在您组织的 Azure 租户中允许公共 Alteryx 应用程序。描述这些步骤的 Microsoft 文档可在 在 Microsoft Azure 门户上构建 URL 以授予租户范围内的管理员同意 中找到。

租户:Gen1 Alteryx 应用程序的 通用 ADLS 客户端 ID:

Gen2 Alteryx 应用程序的 ADLS 客户端 ID: 2584cace-63ff-47cb-96d2-d153704f4d75

完成此设置后,您可以使用正常的 Microsoft 凭证访问 ADLS 数据。

要登录,只需选择 连接 ,然后输入您的 Microsoft 凭证以访问 ADLS 数据。

“终端用户(高级)”身份验证类型

高级终端用户身份验证支持单租户和多租户身份验证,可用于公共和私有应用程序。 Azure 门户 中的凭证设置。

  1. 选择 身份验证授权端点 ,或通过填写 端点 URL (以 http:// 或 https:// 开头)设置 自定义 端点。

  2. 填写 租户(目录)ID - Azure Active Directory 实例的唯一标识符。此标识符控制 ADLS 所属的 Azure 订阅。如需详细了解如何查找租户 ID,请参阅 Microsoft Azure 文档中的 获取租户 ID 。对于公共应用程序,您可以使用“common”。

  3. 客户端(应用程序)ID

  4. 对于私有应用程序,必须提供 客户端密钥

    注意

    对于 2020.3 之前的 Designer 版本,将显示 重定向 URI 字段,并将预填充此字段。在正常使用模式下无需进一步配置。

  5. 选择 连接

服务到服务身份验证类型

“服务到服务”身份验证适用于在 Server 和 Hub 上发布工作流。有关凭证设置,请参阅 Azure 门户 上的说明。

  1. 选择 身份验证授权端点 ,或通过填写 端点 URL (以 http:// 或 https:// 开头)设置 自定义 端点。

  2. 填写 租户(目录)ID - Azure Active Directory 实例的唯一标识符。此标识符控制 ADLS 所属的 Azure 订阅。如需详细了解如何查找租户 ID,请参阅 Microsoft Azure 文档中的 获取租户 ID

  3. 客户端(应用程序)ID

  4. 对于私有应用程序,必须提供 客户端密钥

  5. 选择 连接

共享密钥身份验证类型

“共享密钥”身份验证只能与 Gen2 存储一起使用。对于 Azure 存储账户,Microsoft 将生成两个访问密钥,可用于通过“共享密钥”授权对 Azure 数据湖的访问。您可以在 Azure 门户 中找到有关共享密钥及其用法的更多信息。

  1. 选择 存储 端点 ,或者通过填写 自定义存储 端点 来设置 自定义 端点。

  2. 填写 存储账户名称 - 为您的存储提供的唯一名称。

  3. 输入 存储账户密钥 - 授权访问的访问密钥。

  4. 选择 连接

工具配置

数据 选项卡中,可以指定要使用的数据:

  1. 输入 存储账户名称

  2. 选择 文件系统名称

  3. 选择存储和文件系统后,您可以配置要读取的文件的路径。您可以通过直接输入 文件路径 字段或使用文件浏览器来指定路径。

    您可以选择 将文件下载到本地以便稍后处理 。这允许您处理 Azure 数据湖文件输入不支持的文件类型的文件,或者允许您下载该文件的脱机副本。选择要保存文件的位置。默认位置为 %TEMP%。

  4. 对于 Excel 文件,可以在文件浏览器下的 工作表 字段中指定工作表名称。如果留空,则自动选择第一个工作表。如果是新文件,工作表将被分配默认名称“Sheet”。

选项 选项卡中,您可以设置输入选项(以下选项特定于使用的某些扩展):

  • 文件格式 (支持的文件格式包括 CSV、XLSX、JSON 或 Avro)

  • 最大字段长度

  • 分隔符 - 字段之间的特定边界

  • 数据导入起始行

  • 引号字符

  • 代码页 - 输入字符编码