转换工具
使用转换工具执行以下数据准备任务:
设置数据类型。
清除缺失值。
选择特征。
对数据进行编码。
您可以按任意顺序执行以上操作。具体顺序取决于您如何准备数据。
要求 Alteryx Intelligence Suite
此工具是 Alteryx Intelligence Suite 的一部分。Intelligence Suite 需要单独的许可证,并需要以 Designer 附加组件进行安装。安装 Designer 后,请安装 Intelligence Suite 并 开始您的免费试用 。
重要
您必须将转换工具放在“辅助建模”工具和“分类”或“回归”工具之间。
设置数据类型
从 转换器 部分的下拉列表中选择 设置数据类型 。
特征名称列在 参数 部分的 特征 列中。从 设置数据类型 列的下拉列表中选择特征的数据类型。当前选项为 数值 、 分类值 、 布尔值 和 ID 。
清理缺失值
从 转换器 部分的下拉列表中选择 清理缺失值 。
如需清理某个特征的缺失值,则选中该特征旁边的复选框。
选择清理缺失值的方法:
如果选择此选项,“辅助建模”将用特征总数除以总行数得出的值替换缺失值。请仅对数值数据使用此方法。如果您的数据是正态分布且没有离群值,建议使用此选项。
如果选择此选项,“辅助建模”会将缺失值替换为居于特征分布中间位置的数字。如果您的数据存在倾斜或包含离群值,我们建议使用此选项。
如果选择此选项,“辅助建模”会将缺失值替换为最常出现的数字。如果特征包含分类值,并且您不希望将其丢弃,则推荐使用此选项。您还可使用众数填充缺失的数值。
选择此选项后,“辅助建模”会将空白字段读取为缺失值。如果您认为建模算法可自行在缺失值中找到有价值的发现,则选择此选项,因为有时它能在缺失数据中找到模式。如果您认为其他处理丢失数据的方法可能会使模型产生偏差,则也可以选择此选项。
重要
此工具不会为未选中的特征进行缺失值清理。如果某特征包含缺失值,但未为其选择清理方法,则机器学习管道的下游将发生错误。
选择特征
从 转换器 部分的下拉列表中选择 选择特征 。
如果不想在模型中包含某个特征,请取消选中其名称旁边的复选框。
独热编码
从 转换器 部分的下拉列表中选择 独热编码 。
使用切换键来 隐藏不可编码的特征 。
如果你想要将某个特征转换成机器可读的格式, 则选中该特征旁边的复选框。
使用下拉列表选择工具对特征进行编码的方式:
忽略 允许转换工具对数据进行评分和将未知值视为常量。
错误 指示转换工具在遇到未知值时返回错误。