ユニークツール
ツールごとに学習
ユニークツールには「ツールごとに学習」が用意されています。 サンプルワークフロー を参照して、Alteryx Designer でこのサンプルやその他の多くのサンプルに直接アクセスする方法を確認してください。
ユニークツールを使用すると、指定した 1 つ以上のフィールドによるグルーピングによって、データレコードがユニークであるか重複しているかを判定し、それらのフィールドによって並べ替えられます。
ツールの設定
列名 : 固有値を検索する列を選択します。
レコード全体を比較するには、 すべて選択 ボタンを使用します。データは、固有の列に基づいて、並び替えられます。したがって、特定の並べ替え順序が必要な場合は、 ソートツール を使用して、ファイルの特定の並べ替え順序を割り当ててから、ユニークツールを使用します。 最良の結果を得るには、ソートツールの設定で 辞書順を使用 のチェックを外し、ユニークツールで選択したすべてのフィールドでソートしてから、追加のフィールドでソートします。
すべて選択解除 を使用して、すべてのフィールドの選択を解除します。
出力アンカー
ユニークツールには、2 つの出力アンカーがあります。
U アンカー: データセットの 一意 のレコードが含まれます。各グループの最初のレコードが表示されます。
D アンカー: データセットの 重複 レコードが含まれます。各グループの残りのレコードが表示されます。
重複としてフラグが立てられた行が本当に重複しているかを確認するためには、多くの場合結果のマニュアル検査が必要となります。たとえば、同じ名前で住所が異なる 2 人の顧客がいる場合があります。データセットにこの種の外れ値が含まれている可能性がある場合は、このツールの設定で追加の列を選択することができます。
出力例
サンプルデータセットを使ってユニークツールの出力例を見てみましょう。
入力データストリーム
ユニークツールの [ 設定 ] ウィンドウでは、受信データストリームから 名 列と 姓 列の両方を選択し、姓名の同じ組み合わせの重複エントリが含まれないようにします。
名 | 姓 |
---|---|
Pamela | Wright |
Melissa | Ruff |
Constanti | Vlassis |
Amy | Lockemer |
Danielle | Valdez |
Pamela | Wright |
Mary | Kiniry |
Melissa | Ruff |
Danielle | Valdez |
U アンカーの出力
U 出力アンカーは、上記の入力データストリーム中のすべてのユニークな行を返します。
名 | 姓 |
---|---|
Amy | Lockemer |
Constanti | Vlassis |
Danielle | Valdez |
Mary | Kiniry |
Melissa | Ruff |
Pamela | Wright |
D アンカーの出力
D 出力アンカーは、上記の入力データストリーム中の重複する行を返します。
名 | 姓 |
---|---|
Danielle | Valdez |
Melissa | Ruff |
Pamela | Wright |