サンプリングツール

サンプリングツールは、指定された数、パーセンテージ、またはランダムな行のセットにデータストリームを制限します。 さらに、[サンプリング] ツールでは、選択した設定を [グループ化] するために選択した設定を適用します。

ツールを設定する

  1. サンプルのタイプを選択します。 オプションは次のとおりです。
    • 最初の N 行: データの先頭から N 行までのデータのすべての行を返します。
    • 最後の N 行: データの末尾から N 行離れた行を起点として、すべての行をデータの末尾まで返します。
    • 最初の N 行をスキップ: N 行の後に始まるデータ内のすべての行を返します。
    • N 行毎の1行: N 行のすべてのグループの最初の行を返します。
    • N分の1の確率で各行を含む: 各行がサンプルに含まれているかどうかは、他の行の包含とは無関係にランダムに決定されます。 この選択方法は、N が近似値という結果になります。
    • 1000行がある場合は、ランダムなサンプルを選択し、N を10と指定すると、100行が返されることが期待されます。ただし、75~150のレコードの間のどこかに戻ることもあり得ます。
    • 最初の N% の行: 行の N% を返します。 このオプションを選択するには、データがツールを2回通過する必要があります: 最初に行数を計算し、再度指定されたパーセントの行を返します。
  2. Nの値を指定するには、N = ボックスに数値を入力します。
  3. 列でグループ化 (任意): グループまたは複数のグループが指定されている場合、各グループごとに N 行が返されます。
  4. 「都市」という名前の列でグループ化する場合は、N を2 と指定し、最初のN 行を選択すると、Alteryx は各都市の最初の2行を返します。