Three partially full beakers

サンプリングツール

バージョン:
Current
Last modified: January 13, 2021

サンプリングツールを使用して、データストリームを、指定した数、割合、またはランダムな行セットに制限します。さらに、サンプリングツールでは、選択した設定をグループ化し、選択した列に適用することもできます。

ツール設定

  1. サンプルのタイプを選択します。オプションは、次のとおりです。
    • 最初の N 行: データの先頭から N 行までのデータのすべての行を返します。
    • 最後の N 行: データの末尾から N 行離れた行を起点として、すべての行からデータの末尾までを返します。
    • 最初の N 行をスキップ: N 行の後に始まるデータ内のすべての行を返します。
    • N 行毎に1行: N 行のすべてのグループの最初の行を返します。
    • N分の1の確率で各行を含む: 各行がサンプルに含まれているかどうかは、他の行の包含とは無関係にランダムに決定されます。この選択方法では、N は近似になります。

      1,000 行があり、ランダムなサンプルを選択し、N を 10 と指定すると、100 行が返されると予想されます。ただし、75 - 150 個のレコードが返される場合があります。

    • 最初の N% の行: 行の N% を返します。このオプションでは、ツールでデータが 2 回処理されます。1 回目は行数を計算し、2 回目は指定された割合の行を返します。
  2. N の値を指定するには、N= ボックスに数値を入力します。
  3. 列でグループ化する (オプション): グループまたは複数のグループが指定されている場合、グループごとに N 行が返されます。

    「市区町村」という名前の列でグループ化する場合は、N を 2 と指定し、[最初の N 行] を選択すると、各市区町村の最初の 2 行が返されます。

役に立ちましたか?

Running into problems or issues with your Alteryx product? Visit the Alteryx Community or contact support. Can't submit this form? Email us.