Skip to main content

ユニークツール

ユニークツールを使用すると、指定した1つ以上の列によるグルーピングによって、行がユニークであるか重複しているかを判定し、それらの列によって並べ替えられます。

ヒント

このツールには「ツールごとに学習」があります。 サンプルワークフローへのアクセス を参照して、 Designer Cloud でこのサンプルやその他の多くのサンプルに直接アクセスする方法を確認してください。

ツールの設定

Columns to Find Unique Values: Select the columns you want to check for unique values. Use the Select All checkbox to compare entire rows.

The data is sorted based on the Unique columns. Therefore, if you need a specific sort order, use the Sort tool to assign it to the file prior to using the Unique tool.

出力アンカー

Unique_Tool_Anchors.png

図: 出力アンカーとユニークツール。

ユニークツールには、2 つの出力アンカーがあります。

  • U アンカー: データセットの 一意 の行が含まれます。各グループの最初の行が表示されます。

  • D アンカー: データセットの 重複 行が含まれます。各グループの残りの行が表示されます。

警告

重複としてフラグが立てられた行が本当に重複しているかを確認するために、結果のマニュアル検査が必要となります。たとえば、同じ名前で住所が異なる2人の顧客がいる場合があります。データセットにこの種の外れ値が含まれている可能性がある場合は、このツールの設定で追加の列を選択することができます。

出力例

サンプルデータセットを使ってユニークツールの出力例を見てみましょう。

入力データストリーム

ユニークツールの [ 設定 ] ウィンドウでは、入力データストリームから FirstName 列と LastName 列の両方を選択し、姓名の同じ組み合わせの重複エントリが含まれないようにします。

FirstName

LastName

Pamela

Wright

Melissa

Ruff

Constanti

Vlassis

Amy

Lockemer

Danielle

Valdez

Pamela

Wright

Mary

Kiniry

Melissa

Ruff

Danielle

Valdez

U アンカーの出力

U 出力アンカーは、上記の入力データストリーム中のすべてのユニークな行を返します。

FirstName

LastName

Amy

Lockemer

Constanti

Vlassis

Danielle

Valdez

Mary

Kiniry

Melissa

Ruff

Pamela

Wright

D アンカーの出力

D 出力アンカーは、上記の入力データストリーム中の重複する行を返します。

FirstName

LastName

Danielle

Valdez

Melissa

Ruff

Pamela

Wright