“评分”工具
单个工具示例
“连接”工具有一个单个工具示例。访问示例工作流以了解如何在 Alteryx Designer 中访问此示例和其他更多示例。
“评分”工具通过将R模型应用于一组预测因子来创建目标的估计值。如果目标变量是分类变量,则它提供记录(基于预测变量)属于每个类别的概率。如果目标变量是连续的,则“评分”工具会估计目标变量的值。“评分”工具可用于评估模型性能,但是不能单独使用它来进行评估。
此工具使用 R 工具。转至选项下载预测工具,并登录到 Alteryx 下载和许可证门户以安装 R 和 R 工具使用的软件包。请访问下载和使用预测工具。
模型类型
评分工具可以从多个位置评估模型:
本地模型:模型从本地计算机提取到工作流中,或在数据库中访问。
升级模型:模型存储在升级模型管理系统中。
配置本地型号
可以为标准工作流访问的型号或使用In-DB套件访问的型号配置评分工具。
常规处理下的工具配置
连接输入
“评分”工具需要2个输入连接。
M输入锚点接受R预测工具生成的模型对象。
包含在模型配置中选定的预测变量字段的数据流。这可以是标准的 Alteryx数据流或XDF元数据流。
将这些输入连接到评分工具输入以开始配置。
支持的型号
评分工具可以使用来自预测模型的数据流,即使是使用RevoScaleR函数估计的数据流。仅当建模工具的输入来自XDF输出工具或XDF输入工具并且使用RevoScaleR函数估计模型时,“评分”工具才能使用XDF元数据流。
Oracle R Enterprise使用连接到Oracle数据源的In-DB预测工具估算的模型不能用于对标准 Alteryx数据流进行评分,但使用标准 Alteryx数据流估算的模型可用于对Oracle数据源进行评分。
配置
仅当目标为二进制分类变量时,通过该选项进行的调整才有效。
新字段名称(连续目标)或前缀(分类目标):字段名称或前缀必须以字母开头,并且可以包含字母,数字和特殊字符句点(".")。 和下划线("_")。R 区分大小写。
目标字段具有过采样值:这些字段用于调整拟合概率以匹配真实的样本百分比。选择以提供:
被过度采样的目标字段的值:被过度采样的字段的名称。
过采样前原始数据中的过采样值百分比:在过采样期间重复的值的百分比。
仅限非正则线性回归选项
矿石创建的模型
如果使用ORE创建的模型,原始估计表格必须存在于数据库中才能计算置信区间。
目标字段已进行自然对数转换:选择以应用将值拟合回原始尺度的转换,并使用涂片估计器来考虑后续的转换偏倚。
包括预测置信区间:选择以指定用于计算置信区间的值。
特定于XDF输入的选项
将分数附加到输入XDF文件:选择此选项可将分数附加到输入XDF文件,而不是将分数放置到 Alteryx数据流中。
一次要得分的记录数:选择组中的记录数。输入数据一次对一组进行评分,以避免 R的内存处理限制。
用于数据库内处理的工具配置
评分工具支持Oracle,Microsoft SQL Server 2016和Teradata数据库内处理。有关数据库内支持和工具的详细信息,请访问数据库内概述。
如需访问提升模型工具的数据库内版本,请:
在画布上放置一个数据库内工具。评分工具将自动更改为In-DB版本。
右键单击提升模型工具,指向选择工具版本,然后选择数据库内提升模型。
有关预测型数据库内工具支持的详细信息,请访问预测分析。
连接输入
“评分”工具需要2个输入连接。
M输入锚点接受R预测工具生成的模型对象。
包含在模型配置中选定的预测变量字段的数据流。这可以是标准的 Alteryx数据流或XDF元数据流。
将这些输入连接到评分工具输入以开始配置。
支持的型号
评分工具可以使用来自预测模型的数据流,即使是使用RevoScaleR函数估计的数据流。仅当建模工具的输入来自XDF输出工具或XDF输入工具并且使用RevoScaleR函数估计模型时,“评分”工具才能使用XDF元数据流。
虽然使用标准 Alteryx数据流估算的模型可用于为Oracle数据源评分,但由ORE使用连接到Oracle数据源的In-DB预测工具估算的模型不能用于为标准 Alteryx数据流评分。
配置
不允许使用其它特殊字符,R 区分大小写。
输出表名称:键入要将结果保存到数据库中的表的名称。
新字段名称(连续目标)或前缀(分类目标):字段名称或前缀必须以字母开头,并且可以包含字母,数字和特殊字符句点(".")。 和下划线("_")。
目标字段具有过采样值:这些字段用于调整拟合概率以匹配真实的样本百分比。仅当目标为二进制分类变量时,通过该选项进行的调整才有效。选择以提供:
被过度采样的目标字段的值:被过度采样的字段的名称。
过采样前原始数据中的过采样值百分比:在过采样期间重复的值的百分比。
仅限线性回归的选项
矿石创建的模型
如果使用ORE创建的模型,原始估计表格必须存在于数据库中才能计算置信区间。
目标字段已进行自然对数转换:选择以应用将值拟合回原始尺度的转换,并使用涂片估计器来考虑后续的转换偏倚。
包括预测置信区间:选择以指定用于计算置信区间的值。
针对Teradata的配置:Microsoft Machine Learning服务器需要有关要使用的特定Teradata平台的其他配置信息。此信息通常由本地Teradata管理员提供。
指向R的二进制可执行文件的Teradata服务器路径。
Microsoft Machine Learning服务器使用的临时文件写入位置。
模型来源(仅限Oracle)
模型源:选择传递到评分工具的(M)输入中的模型对象的源。这可以是:
在数据库中,由数据流的"名称"字段中的值标识。
包含在数据流的"对象"字段中。
查看输出
输出包括具有模型预测值的原始数据流。在使用分类目标的模型中,在字段名称中提供目标变量每个水平的预测概率,该字段名称由用户提供的前缀和与目标变量的可能水平相对应的字段后缀组成。
配置升级模型
Promote是一个用于部署,管理和扩展预测模型的平台。Alteryx可以连接到Promote平台以访问存储的模型并对其进行评分。
提升凭证
建立 Alteryx Promote连接 。
Alteryx Promote连接: 用于从保存的升级连接中选择的下拉列表。
Add Connection (添加连接): 添加到可用升级连接列表的选项。Promote连接管理器独立于工作流运行。
添加提升连接
单击 添加连接。
在"添加连接"窗口中,输入 Alteryx Promote URL, 该URL指向模型的存储位置。
选择下一步。
在 Alteryx Promote 凭证窗口中,输入您的 用户名 和 API密钥。
选择连接。
如果成功,请在Connection Established (连接已建立)窗口中选择 Finish(完成)。新连接将被选中并显示在下拉列表中。
删除数据连接
选择现有连接
选择 删除连接。
在Confirmation (确认)窗口中,验证URL和Username (用户名)是否与要删除的连接相关联。
选择确定 。下拉列表中的连接不再可用。
提升访问权限
如果您不确定是否可以使用"升级"功能,或者在查找所需的凭证时需要帮助,请与您的本地管理员或支持代表联系。
模型选择
将生成您有权访问的模型列表。滚动浏览列表或使用搜索功能查找您要评分的模型并选择模型路径。
选择模型路径后,将填充有关模型的信息。
名称:型号名称。
所有者:模型所有者。
状态:模型的当前状态,反映其可访问性。
在线:模型是最新的,并准备处理数据。
正在构建:模型当前正在更新,无法处理数据。
失败的单元测试:模型已完成构建,但组件未能正确构建。模型无法处理数据。
失败:模型无法正确构建,无法处理数据。
离线:模型尚未生成,无法处理数据。
Last Updated(上次更新时间):上次模型构建的时间戳。
验证模型是否可用于数据处理,然后选择完成。
配置总结
配置摘要提供所用凭证的摘要和所选模型的模型摘要。