ユニークツール
ユニークツールを使用すると、行がユニーク(一意)であるか重複しているかを、指定した1つ以上の列によってグルーピングし、それらの列により並べ替えることで判定することができます。
ツールの設定
固有値を検索する列: 固有値を探す列を選択します。[すべて選択]チェックボックスを使用して、行全体を比較します。
出力アンカー
![]() |
図: 出力アンカーとユニークツール。
ユニークツールには、2 つの出力アンカーがあります。
U アンカー: データセットの 一意 の行が含まれます。各グループの最初の行が表示されます。
D アンカー: データセットの 重複 行が含まれます。各グループの残りの行が表示されます。
警告
重複としてフラグが立てられた行が本当に重複しているかを確認するために、結果のマニュアル検査が必要となります。たとえば、同じ名前で住所が異なる2人の顧客がいる場合があります。データセットにこの種の外れ値が含まれている可能性がある場合は、このツールの設定で追加の列を選択することができます。
出力例
サンプルデータセットを使ってユニークツールの出力例を見てみましょう。
入力データストリーム
ユニークツールの[設定]ウィンドウでは、入力データストリームからFirstName列とLastName列の両方を選択し、姓名の同じ組み合わせの重複エントリが含まれないようにします。
FirstName | LastName |
|---|---|
Pamela | Wright |
Melissa | Ruff |
Constanti | Vlassis |
Amy | Lockemer |
Danielle | Valdez |
Pamela | Wright |
Mary | Kiniry |
Melissa | Ruff |
Danielle | Valdez |
U アンカーの出力
U出力アンカーは、上記の入力データストリーム中のすべての一意な行を返します。
FirstName | LastName |
|---|---|
Amy | Lockemer |
Constanti | Vlassis |
Danielle | Valdez |
Mary | Kiniry |
Melissa | Ruff |
Pamela | Wright |
D アンカーの出力
D出力アンカーは、上記の入力データストリーム中の重複する行を返します。
FirstName | LastName |
|---|---|
Danielle | Valdez |
Melissa | Ruff |
Pamela | Wright |
