ARIMAツール
ARIMAツールは、自己回帰統合移動平均(またはARIMA)法を使用して、単変量モデルまたは共変量(予測変数)を持つモデルとして、時系列予測モデルを推定します。 ARIMAは、最も一般的に使用される予測アプローチであり、時系列フィールドを予測するための最も一般的なクラスのモデルとみなされます。 このツールで実装されたARIMAメソッドは、自動化されたアプローチを使用して統計的基準に基づいてモデルを作成することも、ユーザーがARIMAモデルの基本パラメータを直接指定することもできます。 有馬モデルの詳細については、このツールで使用する自動化された方法の説明とともに、Hyndman と Athanasopoulos のオンラインブックの予測: プリンシパルと実践 の第8章で見つけることができます。
このツールはRツールを使用します。 [オプション] > [予測ツールのダウンロード ] に進み、 Alteryxダウンロード/ライセンスポータル R とパッケージをインストールするには、 Rツール。
入力を接続する
予測される時系列に関する履歴データと(オプションで)共変量の集合を含むAlteryxデータストリーム。 モデル作成で使用されないフィールドもデータストリームに存在する可能性があります。
ツールを設定する
[必須パラメータ] タブを使用して、有馬モデルを作成するために必要な基本コントロールを設定します。
- モデル名: 後で識別できるように、各モデルに名前を指定する必要があります。 モデル名は文字で始まり、文字、数字、および特殊文字ピリオド( ".")とアンダースコア( "_")を含む必要があります。 その他の特殊文字は使用できず、Rは大文字と小文字を区別します。
- ターゲットフィールドを選択: 予測するデータストリームからフィールドを選択します。 このフィールドの尺度は、一定の時間間隔(例えば、毎日、毎月、四半期など)で行う必要があります。
- モデルの推定で変量を使用しますか?: このオプションをオンにすると、有馬モデルで変量として使用するフィールドを選択するためのチェックボックスリストがユーザーに表示されます。
- [ターゲットフィールドの頻度]: ターゲットフィールドのオブザベーションの時間間隔を選択します。
サロゲート主キーや自然主キーなどのユニークな識別子を含む列は、統計分析で使用しないでください。 これらの列は予測値がなく、ランタイム例外を引き起こす可能性があります。
[モデルのカスタマイズ (オプション) ] タブを使用して、モデルがデータを処理する方法を調整するコントロールを設定します。
- 自動モデル作成に使用するパラメータをカスタマイズする...:このオプションをクリックすると、自動モデル作成に影響する一連のパラメータが公開されます。 オプションには以下の機能が含まれます:
- 最初の差分のレベル、自己回帰コンポーネントの最大順序、移動平均コンポーネントの最大順序など、非季節的コンポーネントを調整します。
- 季節的な差分のレベル、季節性自己回帰成分の最大次数、および季節移動平均成分の最大次数を含む季節構成要素を調整します。
- 異なる候補モデル間で選択するために使用する情報基準を選択します。 デフォルトでは修正されたAkaike情報基準(AICc)が使用されますが、修正されていないAkaike情報基準(AIC)またはベイジアン情報基準を代わりに選択できます。
- ユーザーは、既定の段階的アルゴリズムを使用する代わりに、すべての可能なモデルを推定し、比較 (完全列挙) するかどうかを決定することもできます。 ステップワイズアルゴリズムは良好な性能特性を有することが示されており、非常に低度に計算的に集中的ですが、最良の単一モデルを見つけることは保証されていません。 すべての可能なARIMAモデルを見積もることで、最高の単一モデルが見つかりますが、ランタイムが大幅に長くなります。 完全列挙が選択されている場合、モデルの最大許容順序を設定することによって、検索されたスペースにいくつかの制限を設けることができます。 加えて、ユーザーには、Alteryxが実行されているマシンの複数のコアを使用するオプションがあります。
- モデルの "ドリフト" と、ターゲットフィールドにBox-Cox変換(ラムダの値の設定を含む)を適用するかどうかのオプションも設定できます。
- 完全にユーザー指定モデル...:このオプションをクリックすると、ユーザーは手動で有馬モデルを指定することができます。 必要なパラメータには次が含まれます:
- 自己回帰成分 (p) の順序の非季節的成分としては、第1の差分 (d) の程度、及び移動平均の次数 (q)がある。
- 季節性自己回帰成分 (P) の順の季節成分、季節差の程度 (D)、および季節移動平均成分 (Q) の順である。
- モデル内の "ドリフト" と、ターゲットフィールドにBox-Cox変換(ラムダの値の設定を含む)を適用するかどうかのオプションも設定できます。
[その他のオプション] タブを使用して、期間の追加パラメータを設定します。
- [連続開始期間 (オプション) ]: このオプションを使用すると、予測プロットに反映される時系列の開始期間を指定できます。
- 予測プロットに含める期間の数:元のデータを含むこのプロットと将来の予測ポイントの数 (予測ポイントの周囲の 80% と 95% の信頼区間と共に)。 ユーザーは、プロットで将来に予測する必要がある期間の数を指定できます。
- 週の形式を選択:これにより、ユーザーは作業週を指定する方法を選択できます。 これらのオプションは、年の最初の週を構成するのは何かと、週が始まるのは何曜日かに関係します。
- 米国 - 日曜日が週の最初の日です
- イギリス - 月曜日が週の最初の日です
- ISO8601 - 月曜日が週の最初の曜日です
[ターゲットフィールドの頻度]が [毎時]、[毎日 (終日)]、または [毎日] (平日のみ) に設定されている場合、このオプションは使用できません。
グラフィック出力のコントロールを設定するには、[グラフィックスオプション] タブを使用します。
- [印刷サイズ]: グラフのサイズに対してインチまたはセンチメートルを選択します。
-
グラフの解像度 : グラフの解像度を1インチあたりのドット数: 1x (96 dpi)、2x (192 dpi)、または 3x (288 dpi) で選択します。 解像度を低くするとファイルサイズが小さくなり、モニタでの表示に最適です。 解像度が高いほど、向上した印刷品質のより大きなファイルを作成できます。
- 基本フォントサイズ (ポイント): グラフ内のフォントのサイズを選択します。
出力を見る
- Oアンカー: ポイント予測の両方に使用できる有馬モデルオブジェクトを含む出力ストリームで構成され、ユーザーがこれらの予測を囲む百分位信頼区間を指定します。
- Rアンカー: 有馬ツールによって生成されたレポートスニペット (統計サマリー、自己相関診断プロット、予測プロット) から成ります。
- 私はアンカー: プロットとメトリックで構成される対話型の html ダッシュボード。 異なるグラフィック要素をクリックして、より多くの情報、値、メトリック、分析を表示して、視覚化データと対話できます。
- ターゲットフィールドの頻度は、毎時、毎日 (終日)、または毎日 (平日のみ) に設定されます。
- ターゲットフィールドの頻度は、週、月、 四半期、または毎年に設定され、 系列の開始期間は設定しません。
予想される動作: プロットの計算
次の構成設定のいずれかが使用されている場合、予測プロットは計算に既定の日付を使用します。
使用される既定の日付は異なる場合があり、計算はランダムに表示されます。