準備
フィールドタイプを、列内に含まれるデータに対して可能な限り最小サイズに設定します。
入力レコードを 2 つまたは 3 つのランダムサンプルに分割します。
null や不要な文字など、一般的なデータ品質の問題を修正します。大文字/小文字の変換
フィルターツールを使用して、条件を使用してデータを選択します。条件を満たすデータ行は、Trueアンカーに出力されます。
フォーミュラツールは、式を使用して列を作成および更新します。
行生成ツールは、レコードレベルで新しいデータのセットを作成します。
インピュテーションツールを使用すると、数値データフィールド内の値を置き換えることができます。
このツールを使用すると、複数のフィールドを使ってタイル作成やビン分割ができます。
複数フィールドフォーミュラツールは、1 つの式を使用して複数のフィールドを作成または更新します。
このツールでは、行データを使用してフォーミュラを作成することにより、式を使用して列を作成および更新します。
このツールにより、負の反応が多いデータを正規化することができます。
入力データストリームのランダムサンプルを返します。
Order your data for further processing or output.
レコードIDは、データ内に新しい列を作成し、データ内の各レコードごとに順番に増加する固有識別子を割り当てます。
このツールは、データストリームを、指定した数、パーセンテージ、またはランダムな行のセットに制限します。
このツールは、指定されたレコードとレコードの範囲を返します。
セレクトツールは、ワークフローを通過するデータの列を含んだり、除外したり、並べ替えたりすることができます。
ソートツールを使用して、指定されたデータフィールドの値に基づいて、テーブル内のレコードを英数字順に整列します。
このツールは、ユーザー指定のメソッドを使用し、データの範囲に基づいて値 (タイル) を割り当てます。
このツールは、指定したフィールドに基づいて、データレコードが固有であるか、重複しているかを区別します。