输入数据工具
Dataset Support in Preview in 2026.1
This initial release of Alteryx One dataset support is in preview. Please refer to Datasets for requirements and limitations.
利用输入数据工具连接到文件或数据库以将数据添加到工作流。
单个工具示例
此工具具有单个工具示例。转到示例工作流,了解如何在 Designer 中直接访问此示例和许多其他示例。
重要
在 Hadoop 分布式文件系统中使用通配符读取多个 CSV 文件会引发错误。
配置工具
“输入数据”的配置窗口有 2 个部分:连接文件或数据库和选项。请注意,连接文件或数据库的配置选项会根据是否启用 DCM 而有所不同。
使用 DCM 连接(默认)
以下步骤介绍在启用数据连接管理器 (DCM) 情况下的默认流程。
将输入数据工具拖放到画布后,按照以下步骤操作:
在配置窗口的连接文件或数据库部分,您可以输入输入文件路径或选择…
打开文件:浏览并连接至本地或网络目录中的文件。请参阅下方的文件部分。
连接至:打开连接器设置窗口。
选择连接至时,Designer 将显示连接器设置窗口。使用以下任一标签页配置您的数据连接:最近、数据集、连接。您还可以通过页面底部的更多下拉菜单访问外部加密保管库并进行同步。
最近处理项
使用最近使用选项卡查看和访问最近使用的连接列表。这部分还包含以下选项的链接:
创建或浏览数据连接:使用 DCM 创建新连接或浏览已创建的连接。如需了解详情,请参阅数据连接管理器。
选择本地存储中的文件:选择要在输入数据工具中使用的本地文件。
在 Alteryx One 上选择数据集:您可以将输入数据工具连接至 Alteryx One 工作区中的可用数据集。这样就可以直接在 Designer 工作流中使用集中管理的数据集。
数据集
2026.1 版预览中的数据集支持
Alteryx One 数据集支持的初始版本为预览版。请注意以下要求和限制:
此功能目前处于公开预览版阶段,正在进行开发。随着 Designer 的更新,重大变更可能会影响在早期版本中创建的资产,因此可能需要更新数据集配置。
要通过输入数据工具连接到数据集,请务必启用 AMP 引擎。
您只能访问根据您的 Alteryx One 用户角色拥有权限的数据集(数据集必须在您的工作区中可用)。
每个输入数据工具只能访问一个数据集。
使用数据集选项卡将输入数据工具连接至 Alteryx One 工作区中的可用数据集。这样就可以直接在 Designer 工作流中使用集中管理的数据集。要在工作流中使用 Alteryx One 数据集…
在连接器设置窗口的左侧菜单中选择数据集。
将显示一个可用数据集列表,包括名称、数据源、所有者、共享对象及上次更新时间。请注意,您只能访问您有权访问的数据集。
您可以筛选列表,以显示所有数据集、仅您拥有的数据集,或仅与您共享的数据集。您也可以使用搜索栏按名称查找数据集。
从可用数据集列表中选择一个数据集。
选择数据集后,输入数据工具将配置为在工作流中使用该数据集。
连接
使用连接选项卡,通过数据连接管理器 (DCM) 访问或创建连接。仅 DCM 支持的连接可用。
“连接”选项卡列出了所有先前创建的连接(包括名称、技术和最近更新信息),以及创建新连接的选项。您可以使用三点图标复制连接 ID、测试连接,或在不再需要时删除连接。
若要将输入数据工具连接到先前创建的连接,请在列表中找到该连接,然后选择连接。
添加新连接
若要通过输入数据工具创建新连接,请按照以下步骤操作:
在“连接”选项卡上,选择 + 新建按钮以打开选择技术窗口。
接下来,您可以从支持的连接列表中选择连接技术。如果需要,您也可以使用“搜索技术”搜索框。
若您选择的技术支持多种连接类型,则会出现选择连接类型窗口。选择连接类型。这可能包括快速连接、使用 ODBC 管理员连接、使用本地暂存进行批量加载、通过 Amazon S3 上的暂存进行批量加载等。
若您选择需要多个连接的批量连接,系统将显示一个屏幕,提示您选择现有的批量连接。
使用选择按钮导航至批量连接部分,然后选择连接以选择连接。
选择多个批量连接后,请选择继续以在工作流中使用它们。
在新建连接屏幕上,请填写相关字段:
连接详细信息:提供连接名称。
数据源:提供数据源名称以及其他必需的数据源特定信息(有关更多信息,请参阅数据源)。
凭证:选择一种身份验证方法,然后输入所选身份验证方法所需的凭证信息(例如,客户端 ID、私密密钥、用户名和密码)。
提供必要信息后,请选择保存以创建连接。您将看到连接详细信息出现。选择连接以在工作流中使用此连接。
外部加密保管库
使用外部加密保管库选项卡,通过 DCM 访问或配置外部加密保管库。如需了解更多信息和操作说明,请转至 DCM 外部加密保管库。
“外部加密保管库”选项卡列出了所有先前创建的加密保管库(包括保管库名称、技术类型和上次更新信息),并提供创建新加密保管库的选项。
同步
借助 DCM,您可以在 Alteryx 应用程序之间同步凭证。如需了解详情,请转至 Designer DCM。
不使用 DCM 连接
重要
Workspace Execution 暂不支持非 DCM 工作流。因此,不建议使用此方法在输入数据工具中创建连接。
以下步骤介绍在禁用数据连接管理器 (DCM) 情况下的流程。
将输入数据工具拖放到画布后,按照以下步骤操作:
在配置窗口的连接文件或数据库部分,您可以输入输入文件路径或选择…
选择连接至时,Designer 将显示数据连接窗口。使用以下某个选项卡配置您的数据连接:最近、已保存、文件、数据源或 Server。
近期(非 DCM)
最近连接部分包含最近配置的文件和数据连接。您可以选择最近的连接,也可以选择清空列表以删除最近的连接。
已保存
选择已保存的连接。要重命名和编辑连接,请使用管理已保存的连接。
文件
要连接至本地或网络目录中的文件,有几个选项可供选择:
在工具配置的“连接文件或数据库”部分,选择打开文件以浏览文件。
连接器设置窗口 (DCM):在最近使用选项卡中,使用选择本地存储中的文件。
数据连接窗口(非 DCM):
在文件连接中,选择选择文件按钮以浏览至文件。
将文件拖到文件连接拖放区。
在所有支持的文件类型部分中,选择一个文件类型扩展名以浏览至该类型的文件。
或者,将文件直接拖到画布上。
在文件浏览窗口中,在输入的文件路径中使用通配符。
如果您拥有多个数据文件,并且
文件拥有相同的字段数量,各字段的数据类型也相同
同一目录中存在类似名称。
通配符注意事项
单个“输入数据”工具可使用通配符格式(如 *.csv 或 2019*.csv)读取多个文件,前提是所有文件的字段数量相同,且各字段的数据类型一致。
Designer 根据读取的第一个文件设置字段数量和文件类型。未能匹配的任何后续文件将被跳过,并显示一条警告。使用 *.csv 这样的通配符语法时,无法控制首先读取哪个文件。将哪个文件指定为第一个文件是由系统决定的。
输入多个文件的文件名中共有的部分,并用一个 *(星号)代替所有后续字符,或用 ? 代替一个字符。指定文件名时请包含通用文件扩展名。
示例 1
该路径包含 data\datafiles 目录下所有以 ABCD 开头的 .csv 文件。
data\datafiles\ABCD*.csv
包括 ABCD_4.csv 和 ABCD_012.csv。
示例 2
该路径包含 data\datafiles 目录下所有以 ABCD_ 开头且文件名后面带 1 个额外字符的 .csv 文件。
data\datafiles\ABCD_?.csv
在选择 Excel 输入中,选择以下 1 个 Excel 输入:
选择工作表:从 Excel 文件中的可用工作表里选择。
选择一个范围(单元格、行或列):或者选择工作表中单元格、行或列的范围。
选择命名范围:从 Excel 文件中的可用命名范围中选择。
仅导入工作表名称列表:创建包含工作表名称作为值的单列输出。选择此选项时,不会输出任何相关数据。
如果选择的 Excel 工作表处于打开状态,则会显示一条错误消息,且您将无法继续。关闭工作表,选择选择 Excel 输入对话框中的刷新按钮,然后完成输入过程。
“输入数据”工具会跳过未定义的列。已定义的列是指包含数据或之前包含数据但被用户清空的列。要包括未定义的列,请通过选择 Excel 输入对话框中的 选择范围(单元格、行或列) 选项指定范围。
文件类型 | 文件扩展名 |
|---|---|
.cydb | |
.yxdb | |
Alteryx Spatial Zip | .sz |
.avro | |
逗号分隔值 | .csv |
dBase | .dbf |
ESRI Personal GeoDatabase | .mdb |
ESRI Shapefile | .shp |
可扩展标记语言 | .xml |
.flat | |
GIS | .grc, .grd |
Google Earth/Google Maps | .kml |
.gz, .tgz | |
IBM SPSS | .sav |
.json | |
MapInfo Professional 表 | .tab |
Microsoft Access 2000-2003 | .mdb |
Microsoft Access 2007, 2010, 2013, 2016 | .accdb |
Microsoft Excel 二进制 | .xlsb |
Microsoft Excel 1997-2003 | .xls |
.xlsx | |
Microsoft Excel Macro-Enabled | .xlsm |
QlikView | .qvx |
SAS | .sas7bdat |
SQLite | .sqlite |
文本 | .txt, .asc |
.zip |
数据源
数据源窗口显示受支持且经常使用的数据源。
工具:如果您为一个尚未安装的工具选择快速连接,系统将会在浏览器中为您打开 Alteryx 社区页面,以便您下载并安装该工具。请仔细阅读页面上的说明。安装工具后,画布上的输入数据工具将变成您在“数据源”选项卡中所选的工具。
数据源:
受支持的数据源
有关支持的数据源详细列表,请转至数据源。
Server
Server 将显示已在本地计算机上添加的各个 Alteryx Server 界面(及其 URL)。每个 Server 名称下方的列表都包含已保存的连接(存储在您可以访问的 Server 上)。
选择 + Server 以添加其他 Alteryx Server 连接。
选项
使用此部分配置文件格式选项。这些选项因您连接的文件或数据库而异。如需了解详情(包括特定于文件的选项和说明),请转至文件格式选项。
预览数据布局
在输入数据工具配置窗口的预览部分预览数据布局。数据布局预览限制为 100 条记录,在加宽文件中则少于 100 条记录。如果数据包含 1500 列,则至少显示 1 条记录,且最多显示 2 行。要查看所有数据,请使用浏览工具。
重复的列名
如果您的输入文件包含多个同名列,Designer 将根据以下规则自动重命名列名重复的列:
如果重复列名中的最后一个字符为 1 或 9,Designer 会在重复列名后附加一个下划线 (_) 和一个以 2 开头的数字。
原始列名 | 重复列名(Designer 重命名为) |
|---|---|
A1 | A1_2 |
A9 | A9_2 |
如果重复列名中的最后一个字符是介于 2 和 8 之间的数字(包括 2 和 8),Designer 将递增该数字以重命名重复的列名。
但是,如果倒数第二个字符也是数字,Designer 会为重复的列名附加一个下划线 (_) 和一个以 2 开头的数字。
原始列名 | 重复列名(Designer 重命名为) |
|---|---|
A2 | A3 |
A5 | A6 |
A22 | A22_2 |
如果重复列名称中的最后一个字符是字母或特殊字符,Designer 将添加一个数字(以 2 开头)以重命名重复的列名称。
原始列名 | 重复列名(Designer 重命名为) |
|---|---|
age | age2 |
registered? | registered?2 |
注意
Visual Query Builder 无法正确显示多字节字符。将会使用表格制表符。
将输出数据工具转换为输入数据工具
您可以将输出数据工具转换为输入数据工具。请按照以下步骤操作:
在工作流画布中,右键单击要转换为输入数据工具的输出数据工具。
选择转换为输入数据。
输出数据将变为输入数据。
