ユニークツールを使用すると、指定した1つ以上の列によるグルーピングによって、行がユニークであるか重複しているかを判定し、それらの列によって並べ替えられます。
ヒント
このツールには「ツールごとに学習」があります。 サンプルワークフローへのアクセス を参照して、 Designer Cloud でこのサンプルやその他の多くのサンプルに直接アクセスする方法を確認してください。
Columns to Find Unique Values: Select the columns you want to check for unique values. Use the Select All checkbox to compare entire rows.
Sort By (Optional): The row position of incoming data isn't preserved. Sort by column to return an accurate range.
![]() |
図: 出力アンカーとユニークツール。
ユニークツールには、2 つの出力アンカーがあります。
U アンカー: データセットの 一意 の行が含まれます。各グループの最初の行が表示されます。
D アンカー: データセットの 重複 行が含まれます。各グループの残りの行が表示されます。
警告
重複としてフラグが立てられた行が本当に重複しているかを確認するために、結果のマニュアル検査が必要となります。たとえば、同じ名前で住所が異なる2人の顧客がいる場合があります。データセットにこの種の外れ値が含まれている可能性がある場合は、このツールの設定で追加の列を選択することができます。
サンプルデータセットを使ってユニークツールの出力例を見てみましょう。
ユニークツールの [ 設定 ] ウィンドウでは、入力データストリームから FirstName 列と LastName 列の両方を選択し、姓名の同じ組み合わせの重複エントリが含まれないようにします。
FirstName | LastName |
---|---|
Pamela | Wright |
Melissa | Ruff |
Constanti | Vlassis |
Amy | Lockemer |
Danielle | Valdez |
Pamela | Wright |
Mary | Kiniry |
Melissa | Ruff |
Danielle | Valdez |
U 出力アンカーは、上記の入力データストリーム中のすべてのユニークな行を返します。
FirstName | LastName |
---|---|
Amy | Lockemer |
Constanti | Vlassis |
Danielle | Valdez |
Mary | Kiniry |
Melissa | Ruff |
Pamela | Wright |
D 出力アンカーは、上記の入力データストリーム中の重複する行を返します。
FirstName | LastName |
---|---|
Danielle | Valdez |
Melissa | Ruff |
Pamela | Wright |