Skip to main content

precision_match_icon.png 表記標準化ツール

ユーザーロール

ユーザーロール*

ツールの利用可否

フルユーザー(アドオンが必要)

ベーシックユーザー

X

*Alteryx Oneプロフェッショナルエディションおよびエンタープライズエディションをご契約中で、Designerバージョン2025.1以降をお使いのお客様に適用されます。

表記標準化ツールは、文字列データに対してファジーマッチのような操作を実行し、同じ語句の異なる表記を1つの値に標準化します。データ内に同じ語句の表記揺れ(例: colorとcolour、USとUnited Statesなど)が含まれている場合に、このツールを活用できます。

注記

生成AIツールは現在パブリックプレビュー版です。パブリックプレビューへの参加方法を確認して、AIを活用したワークフローをはじめましょう!

ツールコンポーネント

表記標準化ツールにはアンカーが5つあります(入力3つ、出力2つ)。

  • M入力アンカー: M入力アンカーを使用して、LLM上書き設定ツールからモデル接続設定を接続します。

  • D入力アンカー: D入力アンカーを使用して、標準化する文字列データを接続します。

  • R入力アンカー(オプション): R入力アンカーを使用して、LLMで使用したい標準化された語句を含む参照データセットに接続します。

  • D出力アンカー: D出力アンカーを使用して、一致した入力データを下流に渡します。

  • M出力アンカー: M出力アンカーを使用して、LLMから出力されるマッピングテーブルを下流に渡します。

ツールの設定

  1. キャンバスに表記標準化ツールを追加します。

  2. D入力アンカーを、ワークフローで使用するカテゴリ文字列データに接続します。表記標準化ツールは、カテゴリデータ(名前や場所など)のみを対象としています。

  3. (オプション) R入力アンカーを、標準化された語句のリストを含む参照データセットに接続します。特に使用したい標準化された語句がある場合は、このアンカーを使用します。それ以外の場合、LLMは組み込みのプロンプトに基づいて独自の決定を行います。

  4. M入力アンカーをLLM上書き設定ツールに接続します。

  5. [フィールドを選択]ドロップダウンから、標準化するデータを含む列を選択します。

  6. [結果の出力方法]セクションで、次のいずれかを選択します。

    • 選択した列を置換: 選択した列を標準化された語句に置き換えます。

    • 新しい列として付加: 標準化された語句を使用してデータセットに新しい列を作成します。(オプション)新しい列の名前を入力します。

  7. (オプション)入力データを変更せず、キャッシュされたマッピングテーブルを使用する場合は、[キャッシュされたマッピングテーブルを使用]のチェックボックスをオンにします。このオプションを使用すると、ワークフローの他の部分で作業する際に、LLMリクエストの数を抑えることができます。

  8. (オプション)ワークフローに動的入力があり、LLMリクエスト数が多くなるのを回避したい場合は、行数の閾値を設定することで、ワークフローにエラーを表示して停止させることができます。[カテゴリ数が値を超えた場合にエラー]のパラメーターに行の閾値を入力します。

  9. ワークフローを 実行 します。

出力

表記標準化ツールには出力アンカーが2つあります。これらは、標準化された語句を2つの方法で下流に渡します。

  • D出力アンカーは、一致する入力データを下流に含めます。[結果の出力方法]セクションで選択した内容に応じて、Dアンカーで以下のいずれかの処理が行われます。

    • [選択した列を置換]を選択した場合、選択した文字列列が標準化された語句で更新されます。

    • [新しい列として付加]を選択した場合、標準化された語句がデータに追加されます。

  • M出力アンカーには、データの標準化に使用されたLLMからのマッピングテーブルが含まれます。マッピングテーブルには、元の文字列値と標準化された文字列値の列が含まれます。