Skip to main content

Alteryx 地理编码应用程序

Alteryx 地理编码应用程序使用多种不同的 Alteryx 工具来清理美国地址,并将其分配给最佳的物理位置匹配点(由纬度和经度表示)。该分析应用程序是一个独立的界面,允许您指定某些参数并执行地理编码过程。

重要

要运行此应用程序,您必须拥有 Alteryx 运行时许可并安装 Alteryx、Alteryx 地理编码器,以及(可选)CASS 编码器和 ZIP+4 编码器。

配置分析应用程序

输入文件

选择输入方法。

通过选择包含地址数据的文件对多个地址进行地理编码

如果该文件尚未通过此应用程序运行,但您勾选了相关复选框,则会收到错误提示。

  • 选择要进行地理编码的文件:浏览并选择要进行地理编码的文件。

  • 仅对未编码的记录进行地理编码:地理编码器会忽略已进行地理编码的记录,仅对 GEO_GeoLevel 字段为“Uncoded”的记录进行编码。

通过手动输入地址,对单个地址进行地理编码

  • 指定要进行地理编码的地址。所有字段均为必填项:在相应字段中输入信息。

完成选择后,选择下一步

地理编码器选项

选择地理编码器:使用下拉列表从可用列表中选择地理编码器

启用 Tom Tom 多网络地址点

  • 匹配和地理编码:选中时,输入记录将与 TomTom 多网络地址点 Calgary 数据库文件匹配。此文件包含约 8000 万个地址点,这些地址点按其地块定位或直接位于建筑结构本身。对于与此文件不匹配的任何记录,系统将按正常方式进行地理编码。

    许可证安装要求

    如需使用此选项,您需要拥有合法获取且正确安装的 TomTom 多网络地址点 Calgary 数据库文件,并启用 CASS 功能。

  • 不匹配文件,仅地理编码:选中时,输入记录按正常方式进行地理编码。

启用交互模式

在交互模式下进行地理编码时,您可以通过交互方式编辑输入地址,并直接与地理编码器进行通信以分配匹配项。

当地理编码器无法自动分配匹配项时,将启动“修改地理编码输入”框。提示此框的事件可能包括:检测到多个匹配项;地址可能有别名;最接近的匹配项得分较低,不够理想;唯一可能的匹配项是邮政编码。如果您对输入数据足够熟悉,可以对原始地址进行适当编辑,以便地理编码器能够分配合适的匹配项。

原始地址显示记录在输入文件中以原生状态显示的方式。

编辑地址是供终端用户输入和修改地址的区域。

终端用户可随时点击地理编码,查看地理编码器识别的可能的匹配项。可能的匹配项会显示在已编辑地址输出框中。

选择一个匹配项,然后选择接受。选择接受匹配项后,原始地址将被替换为接受的地址。

如需前往下一地址,请选择下一条记录,并重复以上过程。

“当前记录”文本会显示您已处理的记录数量以及队列中的总记录数。

选择完成以结束交互过程。

  • 允许交互模式:使用交互模式后,您可以编辑地理编码器无法以原生方式读取的地址,以便对其进行地理编码。

  • 不允许交互模式:如果禁用交互模式,系统将不会提供识别多个匹配项或编辑地址的选项。

地理编码器字段

选择地理编码器输出字段:可用的输出变量取决于使用的地理编码器产品。勾选相应字段旁的复选框,将其附加到地理编码后的数据表中。可使用右侧的选项选择全选选择默认值全部清除。前往街道地理编码器工具

您也可以选择地理编码器高级输出字段

设置好选项后,选择下一步

CASS 选项

启用 CASS 编码:默认情况下,启用 CASS 以支持地理编码,从而与 Tom Tom 多网络地址点匹配,并提供 ZIP+4 编码。

选择 CASS 输出字段:勾选相应字段旁的复选框,将其附加到地理编码后的数据表中。可使用右侧的选项选择全选选择默认值全部清除。如需了解详情,请访问 CASS 工具

您也可以选择高级 CASS 字段

设置好选项后,选择下一步

如果禁用 CASS,则无法将您的地址文件与地址点数据库匹配,也无法提供 ZIP+4 编码。

ZIP+4 编码器

对失败记录使用 ZIP+4 编码器:默认情况下,ZIP+4 编码器已启用。

选择 ZIP+4 编码器字段:勾选相应字段旁的复选框,将其附加到地理编码后的数据表中。可使用右侧的选项选择全选选择默认值全部清除。如需了解详情,请访问 美国 ZIP9 编码器工具

设置好选项后,选择下一步

如果禁用 CASS,则无法向您的地址文件提供 ZIP+4 编码。

输出文件

选择文件以保存地理编码结果:找到要写入地理编码结果的文件位置。汇总文件包含记录的地理编码级别,及该级别下的记录计数。

创建地理编码器汇总文件:如果选择输出汇总文件,请使用选择用于地理编码汇总的文件,并找到目标文件位置。

将未交互编码的记录保存到单独的文件:如果选择输出未编码的结果,请使用未交互编码的记录,并找到目标文件位置。

指定选项后,选择完成

为生成的地理编码记录选择输出文件时,建议不要覆盖输入文件。

疑难解答

如果分析应用程序配置不正确,或者输入文件中有错误,则可能会出现以下错误消息。

必须指定输入文件:未指定输入文件。此外,如果指定的输入文件缺少任何必需字段(如地址、城市、州或邮政编码),也会出现此错误。

必须指定输出文件:未指定输出文件。

必须选择 CASS 才能使用 ZIP+4 编码器:ZIP+4 编码器设置为使用 CASS 进程生成的 ZIP+4 数据。如果未启用 CASS 进程,系统将抛出此错误。您可以返回并启用 CASS,或禁用 ZIP+4 编码器以继续操作。

错误:筛选(244):char(9) 处发生解析错误:未知变量“GEO_GeoLevel”:在“输入文件”选项卡中,选中了可选框,但尚未对指定的输入文件执行地理编码分析应用程序流程。

出现此错误的另一个原因可能是,您输入的 .dbf 文件是该地理编码器上次运行后的输出结果。.dbf 文件有字段长度限制,因此字段会自动截断。请尝试使用没有限制的文件类型,例如 Alteryx 数据库文件 (.yxdb)

公式 (2):在 char(0) 处发生解析错误:类型不匹配。需要字符串时提供了数字。(表达式 1):检查输入文件。您的邮政编码字段可能是数字,但应为字符串。您可以重新设置此字段的格式,保存文件并重试。或者只需将文件保存为 *.csv 文件,然后所有字段都将被读取为文本。

理解返回的代码

在最终的地理编码过程中会返回许多代码。以下是一些代码的简要说明。如需获取更多信息,请访问 Alteryx 运行时目录中的 Alteryx 帮助文件,路径为:

\Program Files\Alteryx\bin\RuntimeData\AlteryxHelp.chm

有不同的引擎会生成不同的字段。字段前缀会指明哪个进程生成了哪些字段。

  • GEO:表示地理编码器返回的字段

  • CASS:表示 CASS 编码器返回的字段

  • ZIP9:表示 ZIP+4 编码器返回的字段。

GEO_GeoLevel 和 GEO_Match Status

这两个字段可能是返回的最重要字段,它们共同描述了地理编码是否成功。

GeoLevel 表示记录的地理编码级别。GeoLevel 有 8 个可能的级别,从最佳到最差依次为:

  • 实际:地址与 TomTom 多网络地址点文件匹配,表示该不动产的实际位置。

  • 街道:地址被分配到插值的街道位置。

  • 交叉路口:地址被分配到多条街道的交叉口。

  • 外推:当输入地址超出范围时,地理编码器会将地址分配到已知的最近有效街道段。

  • ZIP9:地址被分配到 9 位邮政编码或 ZIP+4 编码。

  • ZIP7:地址被分配到 7 位数邮政编码匹配项(不常见,ZIP+4 的前两位)。

  • ZIP5:地址被分配到邮政编码形心。

  • 未编码:没有匹配项。

匹配状态表示记录与 GeoLevel 的匹配程度。按优先顺序排列的可能值如下:

  1. 具体

  2. 多种

最好的匹配组合是:GEO_GeoLevel==Street 和 MatchStatus==Exact

当 GEO_MatchStatus==Exact 和 GEO_GeoLevel==ZIP5 时,记录与 ZIP5 级别完全匹配。这不是街道级别的匹配。

Geo_FirstLineChanged 和 geo_LastLineChanged

这些字段是布尔字段,因此返回的值仅为 TRUE 或 FALSE。这意味着地理编码器返回了一个匹配地址,但原始输入地址的格式有所不同。例如,可能添加了方向性,应用了街道缩写,或邮政编码不同。这些情况下,会返回 TRUE 值。