Skip to main content

Transformation Tool icon 转换工具

使用转换工具执行以下数据准备任务:

  • 设置数据类型。

  • 清除缺失值。

  • 选择特征。

  • 对数据进行编码。

您可以按任意顺序执行以上操作。具体顺序取决于您如何准备数据。

要求 Alteryx Intelligence Suite

此工具是 Alteryx Intelligence Suite 的一部分。Intelligence Suite 需要单独的许可证,并需要以 Designer 附加组件进行安装。安装 Designer 后,请安装 Intelligence Suite 并 开始您的免费试用

重要

您必须将转换工具放在“辅助建模”工具和“分类”或“回归”工具之间。

设置数据类型

  1. 转换器 部分的下拉列表中选择 设置数据类型

  2. 特征名称列在 参数 部分的 特征 列中。从 设置数据类型 列的下拉列表中选择特征的数据类型。当前选项为 数值 分类值 布尔值 ID

清理缺失值

  1. 转换器 部分的下拉列表中选择 清理缺失值

  2. 如需清理某个特征的缺失值,则选中该特征旁边的复选框。

  3. 选择清理缺失值的方法:

如果选择此选项,“辅助建模”将用特征总数除以总行数得出的值替换缺失值。请仅对数值数据使用此方法。如果您的数据是正态分布且没有离群值,建议使用此选项。

如果选择此选项,“辅助建模”会将缺失值替换为居于特征分布中间位置的数字。如果您的数据存在倾斜或包含离群值,我们建议使用此选项。

如果选择此选项,“辅助建模”会将缺失值替换为最常出现的数字。如果特征包含分类值,并且您不希望将其丢弃,则推荐使用此选项。您还可使用众数填充缺失的数值。

选择此选项后,“辅助建模”会将空白字段读取为缺失值。如果您认为建模算法可自行在缺失值中找到有价值的发现,则选择此选项,因为有时它能在缺失数据中找到模式。如果您认为其他处理丢失数据的方法可能会使模型产生偏差,则也可以选择此选项。

重要

此工具不会为未选中的特征进行缺失值清理。如果某特征包含缺失值,但未为其选择清理方法,则机器学习管道的下游将发生错误。

选择特征

  1. 转换器 部分的下拉列表中选择 选择特征

  2. 如果不想在模型中包含某个特征,请取消选中其名称旁边的复选框。

独热编码

  1. 转换器 部分的下拉列表中选择 独热编码

  2. 使用切换键来 隐藏不可编码的特征

  3. 如果你想要将某个特征转换成机器可读的格式, 则选中该特征旁边的复选框。

  4. 使用下拉列表选择工具对特征进行编码的方式:

    • 忽略 允许转换工具对数据进行评分和将未知值视为常量。

    • 错误 指示转换工具在遇到未知值时返回错误。