分割表ツール

代替テーブルツールの使用方法は、 度数分布表ツール、それぞれのフィールドだけを個別に見るのではなく、代替テーブルツールは最大4つの変数/フィールドと、それらが互いにどのように関連しているかを調べます。 このツールは、選択したフィールド間の値の組み合わせをすべて一覧表示する2つの出力 (データ出力) を生成し、[頻度] と [パーセント] 列を使用します。 レポート出力では、フィールド間の値の組み合わせを示すテーブルが作成され、行および列の追加のパーセンテージも含まれます。

ユーザーが2つのフィールドだけを分析している場合は、レポートに含めるカイ二乗統計を出力するように選択することもできます。 カイ2乗統計量は、カテゴリ変数の分布が互いに異なるかどうかを調べるために使用されます。 このオプションを正常に実行するには、Rをインストールする必要があります。

このツールはRツールを使用します。 [オプション] > [予測ツールをダウンロード ] に進み、 Alteryx ダウンロード & ライセンスポータル R と R ツールが使用されるパッケージをインストールするには Rツール。 参照: 予測ツールをダウンロードして使用する

ツールを設定する

  • カイ二乗統計を含める: カテゴリ変数の分布が互いに異なるかどうかを調べるために、カイ二乗 (X 2) 統計が使用されます。 このデータはレポート出力に含まれます。
  • 分析する2つのフィールドを選択します。

  • カイ二乗統計を含めない:少なくとも2つのフィールドと最大4つのフィールドを選択できます。

いずれかのオプションのフィールドを選択するときは、次のルールが適用されます:

  • 各変数にはユニークな値がある必要があります。 値がフィールド全体でユニークでない場合は、エラーがスローされます。
  • 特定のフィールドの種類は選択できません: FixedDecimal、Float、Double、日付、時刻、DateTime、Blob、および SpatialObj。 整数フィールド型は使用できますが、フィールドが本当にカテゴリ化されている場合にのみ使用できます。

出力を見る

Dアンカー: データ出力には、次のフィールドが含まれます。

名前 説明
InputField_SelectedField1 (2, 3, 4) 入力データの元のフィールド名。

選択されたフィールドの数に応じて、InputField_SelectedField3およびInputField_SelectedField4は存在しない場合があり、イタリック体の部分は実際に選択されたフィールド名で更新されます。

頻度 所定のフィールド名の入力データに値が存在する回数。
パーセント (度数/合計レコード)* 100

Rアンカー: レポート出力には、選択された各フィールドの代替テーブルが含まれます。

選択したフィールドのいずれかが警告が表示される数値データ型に設定されている場合、この出力の最初のレコードにはフィールド型の警告が表示されます。 レポートの残りには、フィールド値の組み合わせごとに分割表が表示されます。テーブルのヘッダーには、ユーザーが選択したフィールドと、表に表示されていないフィールドの値が表示されます。 表には、合計列と度数、パーセント、行パーセントおよび列パーセントの行も表示されます。

カイニ乗統計量オプションが選択されている場合は、表の下に次の値が表示されます;カイニ乗、df、およびp値。 カイニ乗は計算されたカイ二乗値であり、dfは自由度であり、p値はRから返される統計値であり、p値が低いほど変数が互いに依存する可能性が高くなります。

私はアンカー: インタラクティブな出力は、ビューアは、ドロップダウンオプションの一連の表示をカスタマイズすることができますグラフが含まれています。