サンプルツール
サンプルツールは、指定された数、パーセンテージ、またはランダムな行のセットにデータストリームを制限します。 さらに、[サンプル] ツールでは、選択した設定を [グループ化] するために選択した列に適用します。
ツールを設定する
- サンプルの種類を選択します。 オプションは次のとおりです。
- 最初の n 行: データの先頭から行 N までのデータのすべての行を返します。
- 最後の n 行: データの末尾から n 行離れた行を起点として、すべての行をデータの末尾まで返します。
- 最初の n 行をスキップ: 行 n の後に始まるデータ内のすべての行を返します。
- n 行ごとの 1: n 行のすべてのグループの最初の行を返します。
- N分の1の確率で各行を含める: 各行がサンプルに含まれているかどうかは、他の行の包含とは無関係にランダムに決定されます。 この選択の結果、N は近似である。
- 行の最初の n%: 行の n% を返します。 このオプションを選択するには、データがツールを2回通過する必要があります: 1 回の行数を計算し、再度指定されたパーセントの行を返します。
- Nの値を指定するには、 N = ボックスに数値を入力します。
- [グループ化] 列 (オプション): グループまたは複数のグループが指定されている場合、グループごとに N 行が返されます。
1000行がある場合は、ランダムなサンプルを選択し、N を10と指定すると、返される100行を取得することが期待されます。ただし、75と150のレコードの間のどこかに戻ることもあり得ます。
「都市」という名前の列でグループ化する場合は、「N」を2 と指定し、最初のN 行を選択すると、Alteryx は各都市の最初の2行を返します。