散布図ツール

[散布図]ツールは余白にボックスプロットを含めるオプション、線形回帰直線、ノンパラメトリック回帰によるスムージング曲線、スムージングされた条件付きスプレッド、外れ値の識別、および回帰直線を含む拡張された散布図を作成します。 スムージング曲線は、特に多くの観測値やデータの分散度が高い場合、従来の散布図に比べて2つの変数間の関係の特性を明らかにすることができます。

このツールはRツールを使用します。 [オプション] > [予測ツールをダウンロード ] に進み、 Alteryx ダウンロード & ライセンスポータル R と R ツールが使用されるパッケージをインストールするには 。 参照: 予測ツールのダウンロードとご利用にアクセスしてください

ツールを設定する

[構成] タブを使用して、散布の必須コントロールを設定します。

  • X (水平) フィールド:プロットの横軸に使用するフィールド。 選択肢は数値フィールドに限られます。
  • Y (垂直) フィールド:プロットの横軸に使用するフィールド。 数値フィールドまたはバイナリカテゴリフィールドのいずれかを使用できます。 バイナリカテゴリフィールドが選択されている場合は、ゼロまたは1の数値を持つ新しいフィールド(元のフィールド名に「.num」というサフィックスが追加されます)が作成されます。 3つ以上の値を持つカテゴリ変数が選択されている場合、ノードはエラーを返します。
  • y フィールドはバイナリカテゴリ変数です: y フィールドがバイナリカテゴリ変数であることを示すチェックボックス。 チェックマークが入っていると、ユーザーは1の値に対応するフィールド値(「ターゲット」)を、0の値をとる他のフィールドのエントリと共に示すように求められます。

[プロット要素] タブを使用して、データのプロット方法のルールを設定します。

  • 最小二乗 (回帰) 線: X と Y のフィールドの間に単純な線形回帰直線を表示します。 デフォルトで含まれています。
  • [滑らかな線]:黄土 (非パラメトリックローカル回帰) モデルを使用して作成された X フィールドと Y 項目の間に直線以外の線を表示します。 既定で含まれる
  • 滑らかなスパン:黄土の見積もりを作成するために使用されるローカル領域のサイズを制御するパラメータ。 数字が小さいほど、使用される面積は小さくなります。
  • 表示スプレッド:元の黄土線からのルート平均二乗正と負の残差の両方に黄土モデルの結果を示す2つの曲線は、エラーの条件付き拡散と非対称性を表示する。 デフォルトで含まれています。
  • 限界箱型図: それぞれのアクセスに沿って X と Y フィールドの一変量箱型図が含まれています。 これは、両方のフィールドの値の分散を評価する際に役立ち、デフォルトで含まれています。
  • ジッタ x:選択した場合、x 値はランダムに少量で混乱されます。 これは、Xフィールドのより多くのレコードが1つまたは少数の値をとる場合に便利です。 それは、回帰直線と黄土線とではなく、グラフ上の出現点にのみ影響します。
  • ジッタ y:選択した場合、y 値は少量でランダムに混乱されます。 これは、Yフィールドのより多くのレコードが1つまたは少数の値をとる場合に便利です。 それは、回帰直線と黄土線とではなく、グラフ上の出現点にのみ影響します。
  • ログ x 軸:選択した場合、自然対数変換が x 値に適用されます。 これを行うと、特定の種類の非線形関係を調べる場合に便利です。
  • [ログ y 軸]: 選択した場合、自然対数変換が y 値に適用されます。 これを行うと、特定の種類の非線形関係を調べる場合に便利です。
  • グループによるプロット: このオプションを使用すると、カテゴリの各値が x と y の値のグループになり、x と y のフィールドの関係に対するカテゴリフィールドの効果を調べることができます。 グループは異なる色とプロット文字でプロットされます。 このオプションが選択されているとき、グループの作成に使用するカテゴリフィールドを(オプションとして)グループごとにプロットされた回帰曲線と黄土曲線、および異なるグループを識別する凡例の位置を与えるかどうかを尋ねられます。

[スタイルオプション] タブを使用して、ラベルや縮尺などのグラフコントロールを設定します。

  • x 軸ラベル (オプション): x (水平) 軸のオプションラベル。 デフォルトでは、Xフィールド名の名前が使用されます。
  • y 軸ラベル (オプション): y (垂直) 軸のオプションラベル。 デフォルトでは、Yフィールド名の名前が使用されます。
  • [ポイントサイズ尺度]:表示内のポイントのサイズをコントロールし、大きな値を指定すると、ポイントサイズが大きくなります。
  • [軸の文字サイズの尺度]:各軸に沿った数値と目盛りのサイズをコントロールし、大きな値を指定するとテキストが大きくなります。
  • [軸ラベルテキストサイズ尺度]:各軸に沿った軸ラベルのサイズをコントロールし、大きな値を指定するとテキストが大きくなります。
  • メインタイトルのテキストサイズの尺度:メインタイトルのテキストのサイズをコントロールし、大きな値を指定すると大きなテキストが生成されます。

グラフィック出力のコントロールを設定するには、[グラフィックスオプション] タブを使用します。

  • [印刷サイズ]: グラフのサイズに対してインチまたはセンチメートルを選択します。
  • グラフ解像度 : グラフの解像度を1インチあたりのドット数: 1x (96 dpi)、2x (192 dpi)、または 3x (288 dpi) で選択します。 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。 解像度を高くするとファイルサイズが大きくなり、印刷品質は向上します。

  • 基本フォントサイズ (ポイント): グラフ内のフォントのサイズを選択します。

出力を見る

カスタムレポートの作成を支援するために使用できるAlteryx R-Graphオブジェクト。