ツールごとに学習
時系列フィルには「ツールごとに学習」が用意されています。サンプルワークフロー を参照して、このサンプルを含むさまざまなサンプルをAlteryx Designerで直接利用する方法をご確認ください。
時系列フィルツールを使用して、時系列データのデータストリームを取り込み、時系列内の空白を埋めます。
このツールは、主にダウンストリームの時系列関連のツールとマクロを使用するための準備ステップとして使用されます。データストリームに時系列の空白が含まれている場合、たとえば、5分おきの測定値が含まれると思われる一連のデータがあるけれど、実際には5分おきの測定値がないという場合に、時系列ツールで予期しない結果やエラーが発生することがあります。データストリームに空白がある可能性があると思われる場合は、いつでもこのマクロを使用してください。
注記
このツールはRツールを使用します。[オプション] > [予測ツールのダウンロード]に移動し、[Alteryxダウンロードとライセンス]ポータルにサインインして、Rツールで使用するパッケージとRツールをインストールします。予測ツールのダウンロードと使用を参照してください。
時系列フィルツールには、日付または日時の値の列を持つDesignerデータストリームが必要です。
[設定]タブを使用して、時系列の入力方法のコントロールを設定します。
日付または日時の列を選択: データ行がいつ収集されたかを示す、日付または日時列を選択します。
間隔: 時系列を測定する間隔を選択します。選択肢には、[分]、[時間]、[日]、[週]、[月]、[年]があります。
増分: ユニークな時系列の期間ごとの増分を選択します。増分は1から100までの任意の整数に設定できます。
「3週間ごと」に対応する系列を生成するには、[間隔]を週に設定し、[増分]を3に設定します。
マクロに入るすべての行が出力に表示されます。さらに、このマクロは時系列の期間が欠落しているかどうかを調べて、欠落している場合は、空白を埋める行を生成します。
このツールは、着信データストリームに2つのデータ列を付加します。
OriginalDateTime: 元の変更されていない日時値が含まれる日付時刻列。
FlagGeneratedRow: ブール値フラグの列。「True」はデータ行が時系列の空白を埋めるマクロによって生成されたことを示します。「False」は、それがソースデータ行であることを示します。
マクロを通過するソースデータ行の場合:
FlagGeneratedRow列は「False」になり、それがマクロによって生成された行ではなく、ソースデータ行であることを示します。
yourDateTimeColumn列は、適切な期間に「丸められ」ます。以下の丸めセクションを参照してください。
他のすべてのソース列は変更されずに通過します。
空白を埋めるために生成された行の場合:
FlagGeneratedRow列は「True」になり、それがソースデータ行ではなくマクロによって生成された行であることを示します。
yourDateTimeColumn列には、時系列で識別された空白を「埋める」マクロによって生成された日付または日時の値が入力されます。
他のすべての列はNullです。
最も一般的なビジネス使用シナリオごとに、時系列の期間は次のように処理されます。
「時間レベル」: 間隔用
「日付レベル」: 間隔 > = 1日の場合、期間は「期間終了」です。
マクロが入力データに対して行う唯一の変更は、yourDateTimeColumnに「丸め」が適用されることです。これは3つの重要な要素に基づいています。
間隔
データストリーム内の最も古い日時の値
インクリメント
まず、選択された間隔のすべての小数位が切り捨てられます。たとえば、間隔に「時間」を選択した場合、このマクロは日時の値から分と秒を切り捨てます。したがって、たとえば、午後1時58分は午後1時になります。
選択した間隔の端数を切り捨てた後、マクロは有効期間が何であるかを決定します。マクロに入る最も古い日時の値が、時系列の基盤になります。上記の「時系列」の例で、yourDateTimeColumnの最も古い日時が午後1時58分だった場合、最初の期間は午後1時です。選択されたインクリメントが5の場合、後続の期間は、選択した前の期間からのインクリメントである5を加算していくことで生成されます。この例の場合は午後1時、午後6時、午後11時と続きます。
最後に、すべての有効期間が決定されたので、すべての日時値が適切な有効期間に調整されます。つまり、yourDateTimeColumnの午後5時59分の生の値は午後5時になり、午後6時2分は午後6時になります。
マクロによって日時の調整がすべて適用された後、yourDateTimeColumnの結果が、その期間の実際の「ラベル」になります。しかし、データ型は(文字列ではなく)日付または日時の列であるため、この「ラベル」は完全に直観的にならない可能性があります。ここで重要なのは、選択した間隔の日付または日時「ラベル」におけるすべての「小数位」部分は、無視する必要があることです。したがって、間隔が「年」の場合、この例の期間は「2018-01-01」になりますが、このラベルで重要なのはその年です。「01-01」というラベルの小数部分は無視することが必要です。つまり、この期間は単純に2018年、または「2018年の任意の時間」になります。下の表を参照してください。
上記で説明した日時の「丸め」とは別に、このマクロでは入力データが変更されないことに注意してください。入力データに対する結合、要約、一意化、あらゆるタイプの検証は行われません。ただし、日付の丸めのため、同じ期間内の複数の測定に同じ期間ラベルが付きます。このように、データは今やよりクリーンになり、データはこの一貫性のある、丸められた期間ラベル「によりグループ化」できるためため、いつでもサマライズできるようになります。
マクロは夏時間を考慮していないので、夏時間のカットオーバを超える時間レベルの時系列がある場合、マクロが無効な時間を表す1時間の行(または分の行)を生成する可能性があります。たとえば、3月に1時間「春に進める」エリアは、たとえその時間が実際には発生しない場合でも、春に進める日に2時間分の行が生成されます。この時は、マクロの後のフィルタリングツールで簡単に削除できます。
わかりやすくするために、以下のテーブルに、使用可能な間隔オプションと、必要なデータ型、その間隔タイプの期間は「期間の開始」か「期間の終了」の間隔かを示します。その次に、インクリメントの例、時系列の「最初の生の値」を示し、結果の期間の「ラベル」がどのようなものか、その期間ラベルが実際どういう意味か(英語)を示します。テーブルの最後に、期間ラベルのどの部分を原則的に無視すべきかを示します(その間隔の端数部分など)。
間隔 | 返されるデータ型 | 期間の開始/終了 | 例のインクリメント | 最初の生の値の例 | 最初の期間レベルの結果 | 期間の説明 | 期間ラベルを無視する |
---|---|---|---|---|---|---|---|
分 | 日時 | 開始する | 2 | 2015-04-09 02:16:33 | 2015-04-09 02:16:00 | 「2:16からの2分間。2:16と2:17のすべてに対応」 | 秒 |
時間 | 日時 | 開始する | 4 | 2015-04-09 02:16:33 | 2015-04-09 02:00:00 | 「2時からの4時間。2時、3時、4時、5時のすべてに対応」 | 分以下 |
日 | 日付 | 終わり | 6 | 2015-04-09 02:16:33 | 2015-04-09 | 「4/9に終わる6日間は、4/4~4/9のすべてに及びます。」 | 時以下 |
週 | 日付 | 終わり | 1 | 2015-04-09 02:16:33 | 2015-04-09 | 「4/9に終わる1週間は、4/3から4/9のすべてに及びます。」 | 時以下 |
月 | 日付 | 終わり | 3 | 2015-04-09 02:16:33 | 2015-04-01 | 「4月に終わる3月の期間は、2月、3月、4月のすべてに及びます。」 | 日以下 |
年 | 日付 | 終わり | 2 | 2015-04-09 02:16:33 | 2015-04-01 | 「2014年に終わる2年間は、2014年と2015年のすべてに及びます。」 | 月以下 |