サンプルツール

サンプルツールは、指定された数、パーセンテージ、またはランダムな行のセットにデータストリームを制限します。

ツールを設定する

  1. サンプルの種類を選択します。 オプションは次のとおりです。
    • 最初の n 行: データの先頭から行 N までのデータのすべての行を返します。
    • 最後の n 行: データの末尾から n 行離れた行を起点として、すべての行をデータの末尾まで返します。
    • 最初の n 行をスキップ: 行 n の後に始まるデータ内のすべての行を返します。
    • n 行ごとの 1: n 行のすべてのグループの最初の行を返します。
    • N分の1の確率で各行を含める: 各行がサンプルに含まれているかどうかは、他の行の包含とは無関係にランダムに決定されます。 この選択の結果、N は近似である。
    • 1000行がある場合は、ランダムなサンプルを選択し、N を10と指定すると、返される100行を取得することが期待されます。ただし、75と150のレコードの間のどこかに戻ることもあり得ます。
    • 行の最初の n%: 行の n% を返します。 このオプションを選択するには、データがツールを2回通過する必要があります: 1 回の行数を計算し、再度指定されたパーセントの行を返します。
  2. Nの値を指定するには、 N = ボックスに数値を入力します。
  3. [グループ化] 列 (オプション): グループまたは複数のグループが指定されている場合、グループごとに N 行が返されます。