データクレンジングツール
データクレンジングツールは、さまざまなパラメータを使用して共通のデータ品質の問題を修正します。
既知の制限: 動的ワークフロー
データクレンジングツールは動的ではありません。 新しく生成されたフィールドの名前で動作することを目的とするマクロのような動的な設定で使用された場合、ツールはすべてのオプションが選択されていてもフィールドと相互作用しません。 データクレンジングツールを マルチフィールドフォーミュラツール。
ツールを設定する
既知の制限: 大数の処理
15桁を超える数字は、文字列として扱う必要があり、そうでない場合は精度を失います。 フィールドタイプを文字列に設定します。 選択ツール。
次のフィールドを使用して、データ品質の問題の管理方法を決定します。
クレンジングするフィールドを選択: 以下の構成オプションを使用して、クレンジングするフィールドを選択します。 Nullを0と置き換え以外のすべてのオプションは、文字列データ型に適用されます。 フィールドごとに異なるオプションを指定するには、ワークフローで複数のデータクレンジングツールを使用します。
null を置き換える: null を空白または0以外の値に置き換えるには、 iインピュテーションツール。
- 空白 (文字列フィールド) で置き換える: 空白は、[Null] ではなく""として登録します。 デフォルトで選択されています。
- 0 (数値フィールド) で置き換える: デフォルトで選択されています。
- 先頭と末尾の空白文字 はデフォルトで選択されています。
- タブ、改行、および空白の重複 では空白の出現箇所を、行末、タブ、複数のスペース、その他の連続した空白を含む1つのスペースに置き換えます。
- すべての空白 空白の発生をすべて削除します。
- 文字 すべての文字を削除します。 これには、ラテンアルファベット以外の文字も含まれます。
A b Z À é ö
- 数値 すべての数値を削除します。
- 句読点 以下の文字を削除します。
!" # $ % & ' ( ) * + , \ - . / : ;< = > ?@ [ / ] ^ _ ` { | } ~
文字列データ型の大文字化ルールを変更するオプションを選択します。
- 大文字 文字列内のすべての文字を大文字にします。
- 小文字 文字列内のすべての文字を小文字に変換します。
- タイトルケース 文字列内のすべての単語の先頭文字を大文字にします。