表記標準化ツール
ユーザーロール
ユーザーロール* | ツールの利用可否 |
---|---|
フルユーザー(アドオンが必要) | ✓ |
ベーシックユーザー | X |
*Alteryx Oneプロフェッショナルエディションおよびエンタープライズエディションをご契約中で、Designerバージョン2025.1以降をお使いのお客様に適用されます。
表記標準化ツールは、文字列データに対してファジーマッチのような操作を実行し、同じ語句の異なる表記を1つの値に標準化します。データ内に同じ語句の表記揺れ(例: colorとcolour、USとUnited Statesなど)が含まれている場合に、このツールを活用できます。
注記
生成AIツールは現在パブリックプレビュー版です。パブリックプレビューへの参加方法を確認して、AIを活用したワークフローをはじめましょう!
ツールコンポーネント
表記標準化ツールにはアンカーが5つあります(入力3つ、出力2つ)。
M入力アンカー: M入力アンカーを使用して、LLM上書き設定ツールからモデル接続設定を接続します。
D入力アンカー: D入力アンカーを使用して、標準化する文字列データを接続します。
R入力アンカー(オプション): R入力アンカーを使用して、LLMで使用したい標準化された語句を含む参照データセットに接続します。
D出力アンカー: D出力アンカーを使用して、一致した入力データを下流に渡します。
M出力アンカー: M出力アンカーを使用して、LLMから出力されるマッピングテーブルを下流に渡します。
ツールの設定
キャンバスに表記標準化ツールを追加します。
D入力アンカーを、ワークフローで使用するカテゴリ文字列データに接続します。表記標準化ツールは、カテゴリデータ(名前や場所など)のみを対象としています。
(オプション) R入力アンカーを、標準化された語句のリストを含む参照データセットに接続します。特に使用したい標準化された語句がある場合は、このアンカーを使用します。それ以外の場合、LLMは組み込みのプロンプトに基づいて独自の決定を行います。
M入力アンカーをLLM上書き設定ツールに接続します。
[フィールドを選択]ドロップダウンから、標準化するデータを含む列を選択します。
[結果の出力方法]セクションで、次のいずれかを選択します。
選択した列を置換: 選択した列を標準化された語句に置き換えます。
新しい列として付加: 標準化された語句を使用してデータセットに新しい列を作成します。(オプション)新しい列の名前を入力します。
(オプション)入力データを変更せず、キャッシュされたマッピングテーブルを使用する場合は、[キャッシュされたマッピングテーブルを使用]のチェックボックスをオンにします。このオプションを使用すると、ワークフローの他の部分で作業する際に、LLMリクエストの数を抑えることができます。
(オプション)ワークフローに動的入力があり、LLMリクエスト数が多くなるのを回避したい場合は、行数の閾値を設定することで、ワークフローにエラーを表示して停止させることができます。[カテゴリ数が値を超えた場合にエラー]のパラメーターに行の閾値を入力します。
ワークフローを 実行 します。
出力
表記標準化ツールには出力アンカーが2つあります。これらは、標準化された語句を2つの方法で下流に渡します。
D出力アンカーは、一致する入力データを下流に含めます。[結果の出力方法]セクションで選択した内容に応じて、Dアンカーで以下のいずれかの処理が行われます。
[選択した列を置換]を選択した場合、選択した文字列列が標準化された語句で更新されます。
[新しい列として付加]を選択した場合、標準化された語句がデータに追加されます。
M出力アンカーには、データの標準化に使用されたLLMからのマッピングテーブルが含まれます。マッピングテーブルには、元の文字列値と標準化された文字列値の列が含まれます。