ツールごとに学習
ARIMAには「ツールごとに学習」が用意されています。サンプルワークフロー を参照して、このサンプルを含むさまざまなサンプルをAlteryx Designerで直接利用する方法をご確認ください。
ARIMAツールは、自己回帰統合移動平均(またはARIMA)法を使用して、単変量モデルまたは共変量(予測変数)を持つモデルとして、時系列予測モデルを推定します。ARIMAは、最も一般的に使用される予測アプローチです。時系列フィールドを予測するための最も一般的なクラスのモデルとみなされます。このツールに実装されたARIMAメソッドは、自動化されたアプローチを使用して統計的基準に基づいてモデルを作成したり、ユーザーがARIMAモデルの基本パラメーターを直接指定したりできます。ARIMAモデルの詳細な説明と、このツールで使用される自動化されたメソッドの説明は、HyndmanとAthanasopoulosのオンラインブック予測: 原則と実践の第8章にあります。
注記
このツールはRツールを使用します。[オプション] > [予測ツールのダウンロード]に移動し、[Alteryxダウンロードとライセンス]ポータルにサインインして、Rツールで使用するパッケージとRツールをインストールします。予測ツールのダウンロードと使用を参照してください。
予測される時系列に関する履歴データと、(オプションで)一連の共変量が含まれるAlteryxデータストリームを接続します。モデル作成で使用されないフィールドもデータストリームに存在する可能性があります。
[必須パラメーター]タブを使用して、ARIMAモデルの作成に必要な基本コントロールを設定します。
モデル名: 各モデルには後で識別できるように名前を付ける必要があります。モデル名は文字で始まる必要があり、文字、数字、および特殊文字ピリオド (".") とアンダースコア ("_") を含むことができます。その他の特殊文字は使用できません。Rは大文字と小文字を区別します。
ターゲットフィールドを選択: 予測するデータストリームからフィールドを選択します。このフィールドの測定は、一定の時間間隔(例: 毎日、毎月、四半期など)で行う必要があります。サロゲート主キーやナチュラル主キーなどの固有識別子を含む列は、統計分析で使用しないでください。これらの列は予測値がなく、実行時に例外処理を引き起こす可能性があります。
モデル推定に共変量を使用しますか?: このオプションにチェックを入れると、ARIMAモデルで共変数として使用するフィールドを選択できるチェックボックスリストが表示されます。
ターゲットフィールドの頻度: ターゲットフィールドの観測時間間隔を選択します。
[モデルのカスタマイズ(オプション)]タブを使用して、モデルのデータの処理方法を調整するコントロールを設定します。
自動モデル作成に使用するパラメーターをカスタマイズする: このオプションを選択して、自動モデル作成に影響するパラメーターのセットを示します。このオプションには以下の機能が含まれます。
第1の差分のレベル、自己回帰成分の最大次数、移動平均成分の最大次数などの非季節要因を調整します。
季節的差分のレベル、季節的自己回帰成分の最大次数、季節的移動平均成分の最大次数などの季節要因を調整します。
さまざまな候補モデルの選択に使用する[情報基準]を選択します。既定では、修正されたAkaike情報基準(AICc)が使用されますが、修正されていないAkaike情報基準(AIC)またはベイジアン情報基準も選択できます。
既定のステップワイズアルゴリズムを使用する代わりに、すべての可能なモデルが推定され比較されるかどうか(完全列挙)を決定することもできます。ステップワイズアルゴリズムは良好な性能特性を有することが示されており、計算的な負担は非常に低いですが、最良の単一モデルを見つけることは保証されていません。すべての可能なARIMAモデルを見積もることで、最高の単一モデルが見つかりますが、ランタイムが大幅に長くなります。完全列挙を選択した場合、モデルの最大許容順序を設定することで、検索されたスペースにいくつかの制限を設けることができます。さらに、Alteryxが実行されているマシンの複数のコアを使用するオプションもあります。
モデルの "ドリフト" と、ターゲットフィールドにBox-Cox変換(ラムダの値の設定を含む)を適用するかどうかのオプションも設定できます。
完全にユーザー指定のモデル :手動でARIMAモデルを指定するには、このオプションを選択します。必要なパラメーターには以下が含まれます。
自己回帰成分の次数(p)、第1差分の程度(d)、移動平均の次数(q)の非季節的要因。
季節的自己回帰成分の次数(P)、季節的差分の程度(D)、季節的移動平均成分の次数(Q)の季節的要因
モデル内の "ドリフト" と、ターゲットフィールドにBox-Cox変換(ラムダの値の設定を含む)を適用するかどうかのオプションも設定できます。
[その他のオプション]タブを使用すると、期間の追加のパラメーターを設定できます。
時系列開始期間(オプション): 予測プロットに反映する時系列の開始期間を指定できます。[ターゲットフィールドの頻度]が[毎時]、[毎日(すべての日)]、[毎日](平日のみ)]のいずれかに設定されてる場合、このオプションは使用できません。
予測プロットに含める期間の数: このプロットには、元のデータと予想される将来のポイント数が含まれます(予測ポイント周辺の80%と95%の信頼区間があります)。プロットで将来に予測する必要がある期間の数を指定できます。
週形式を選択: これにより就労日を指定する方法を選択できます。これらのオプションは、年の最初の週を構成するのは何かと、週が始まるのは何曜日かに関係します。
米国: 日曜日が週の最初の日です。
英国: 月曜日が週の最初の日です。
ISO8601: 月曜日が週の最初の日です。
[グラフィックオプション]タブを使用して、グラフィック出力のコントロールを設定します。
プロットサイズ: グラフのサイズをインチとセンチメートルのどちらにするかを選択します。
グラフの解像度: グラフの解像度を1インチあたりのドット数で選択します: 1x (96 dpi)、2x (192 dpi)、3x (288 dpi)
解像度を低くするとファイルサイズが小さくなり、モニターでの表示に最適です。
解像度を高くするとファイルサイズが大きくなり、印刷品質が向上します。
ベースフォントサイズ (ポイント): グラフ内のフォントのサイズを選択します。
Oアンカー: ポイント予測とそれらの予測を囲むユーザー指定のパーセンタイル信頼区間の両方に使用できる、ARIMAモデルオブジェクトが含まれる出力ストリームで構成されます。
Rアンカー: ARIMAツールによって生成されたレポートスニペット(統計的な要約、自己相関診断プロット、予測プロット)で構成されます。
Iアンカー: プロットとメトリックで構成されるインタラクティブなHTMLダッシュボードです。可視化ツールとやり取りするさまざまなグラフィック要素を選択すると、より多くの情報、値、指標、分析が表示されます。
予想される動作: プロットの計算
予測プロットでは、以下のいずれかの構成設定の場合、計算に既定の日付が使用されます。
[ターゲットフィールドの頻度]が[毎時]、[毎日(すべての日)]、[毎日(平日のみ)]のいずれかに設定されている。
[ターゲットフィールドの頻度]が[毎週]、[毎月]、[四半期ごと]、[毎年]のいずれかに設定され、[時系列開始期間]が設定されていない。
使用される既定の日付はさまざまで、その計算はランダムです。