Skip to main content

Transformation Tool icon 转换工具

使用转换工具执行以下数据准备任务:

  • 设置数据类型。

  • 清除缺失值。

  • 选择特征。

  • 对数据进行编码。

您可以按任意顺序执行以上操作。具体顺序取决于您如何准备数据。

要求 Alteryx Intelligence Suite

此工具是 Alteryx Intelligence Suite 的一部分。Intelligence Suite 需要单独的许可证,并需要以 Designer 附加组件进行安装。安装 Designer 后,请安装 Intelligence Suite 并开始您的免费试用

重要

您必须将转换工具放在“辅助建模”工具和“分类”或“回归”工具之间。

设置数据类型

  1. 转换器 部分的下拉列表中选择 设置数据类型

  2. 特征名称列在 参数 部分的 特征 列中。从 设置数据类型 列的下拉列表中选择特征的数据类型。当前选项为 数值 分类值 布尔值 ID

清理缺失值

  1. 转换器 部分的下拉列表中选择 清理缺失值

  2. 如需清理某个特征的缺失值,则选中该特征旁边的复选框。

  3. 选择清理缺失值的方法:

如果选择此选项,“辅助建模”将用特征总数除以总行数得出的值替换缺失值。请仅对数值数据使用此方法。如果您的数据是正态分布且没有离群值,建议使用此选项。

如果选择此选项,“辅助建模”会将缺失值替换为居于特征分布中间位置的数字。如果您的数据存在倾斜或包含离群值,我们建议使用此选项。

如果选择此选项,“辅助建模”会将缺失值替换为最常出现的数字。如果特征包含分类值,并且您不希望将其丢弃,则推荐使用此选项。您还可使用众数填充缺失的数值。

选择此选项后,“辅助建模”会将空白字段读取为缺失值。如果您认为建模算法可自行在缺失值中找到有价值的发现,则选择此选项,因为有时它能在缺失数据中找到模式。如果您认为其他处理丢失数据的方法可能会使模型产生偏差,则也可以选择此选项。

重要

此工具不会为未选中的特征进行缺失值清理。如果某特征包含缺失值,但未为其选择清理方法,则机器学习管道的下游将发生错误。

选择特征

  1. 转换器 部分的下拉列表中选择 选择特征

  2. 如果不想在模型中包含某个特征,请取消选中其名称旁边的复选框。

独热编码

  1. 转换器 部分的下拉列表中选择 独热编码

  2. 使用切换键来 隐藏不可编码的特征

  3. 如果你想要将某个特征转换成机器可读的格式, 则选中该特征旁边的复选框。

  4. 使用下拉列表选择工具对特征进行编码的方式:

    • 忽略 允许转换工具对数据进行评分和将未知值视为常量。

    • 错误 指示转换工具在遇到未知值时返回错误。