Skip to main content

Three partially full beakers サンプリングツール

ツールごとに学習

サンプリングツールには「ツールごとに学習」が用意されています。 サンプルワークフロー を参照して、このサンプルを含むさまざまなサンプルを Alteryx Designer で直接利用する方法をご確認ください。

サンプリングを使用して、データストリームを指定した数、割合、またはランダムな行セットに制限します。さらに、サンプリングツールでは、選択した設定をグループ化し、選択した列に適用することもできます。

ツールの設定

  1. [サンプリング方法] の項目で、サンプルのタイプを選択します。オプションは、次のとおりです。

    • 最初のN行 : データの先頭からN行までのデータのすべての行を返します。

    • 最後のN行 : データの末尾からN行離れた行を起点として、すべての行からデータの末尾までを返します。

    • 最初のN行をスキップ : N行の後に始まるデータ内のすべての行を返します。

    • N行毎に1行 : N行のすべてのグループの最初の行を返します。

    • N分の1の確率で各行を含む : 各行がサンプルに含まれているかどうかは、他の行の包含とは無関係にランダムに決定されます。この選択方法では、Nは近似になります。

      ヒント

      1,000行があり、ランダムなサンプルを選択し、Nを10と指定すると、100行が返されると予想されます。ただし、実際には75- 150個のレコードが返される場合があります。

    • 最初の N%の行 : 行のN%を返します。このオプションでは、ツールでデータが2回処理されます。1回目は行数を計算し、2回目は指定された割合の行を返します。

  2. Nの値を指定するには、 N= ボックスに数値を入力します。

  3. 列でグループ化(オプション) : データセットからグループ化する列を選択します。すべての列でグループ化する場合は、 [すべて選択] チェックボックスを使用します。1つ以上のグループが指定されている場合は、グループごとにN行が返されます。

    ヒント

    「City」という名前の列でグループ化する場合は、Nを2と指定し、[最初のN行] を選択すると、各City列の最初の2行が返されます。