
TSフィラーツール
時系列フィラーを使用して、時系列データのデータストリームを取得し、系列内のギャップを埋めます。
このツールは、主にダウンストリームの時系列関連のツールとマクロを使用するための準備ステップとして使用されます。 時系列ツールの中には、データ ストリームに時系列のギャップが含まれている場合に予期しない結果やエラーが発生するものもあります。 データストリームに空白がある可能性があると思われる場合は、いつでもこのマクロを使用してください。
このツールはRツールを使用します。 [オプション] > [予測ツールのダウンロード] に移動し、Alteryx のダウンロードとライセンスのポータルにサインインして、R とR ツールで使用されるパッケージをインストールします。 参照: 予測ツールのダウンロードとご利用
入力を接続する
TS 充填ツールには、日付または日付/時刻の値を含む列を持つデザイナー データ ストリームが必要です。
ツール設定
[ 構成 ] タブを使用して、時系列の入力方法のコントロールを設定します。
- [日付] または [日付時刻列] : データ行が収集された日時を示す日付列または日付時刻列を選択します。
- 間隔: 時系列の測定間隔を選択します。 オプションには、 分、 時間、 日、 週、 月、 年などがあります。
- 増分: 一意の期間を区切る増分を選択します。 インクリメントは、1 ~ 100 の任意の整数に設定できます。
例
"3 週間ごと" をカバーするシリーズを生成するには、間隔を週に設定し、 3 にインクリメントします。
出力の表示
マクロを入力するすべての行が出力に表示されます。 さらに、マクロは、時系列内の任意の期間が欠落しているかどうかを評価し、その場合はギャップを埋めるための行を生成します。
このツールは、着信データストリームに2つのデータ列を付加します。
- 元の日付時刻: 変更されていない元の日時値を含む日付時刻列
- フラグ生成行: "True" は、データ行が時系列の間隔を埋めるためにマクロによって生成されたことを示し、"False" は、それがソース データ行であることを示すブール型フラグ列です。
マクロを通過するソースデータ行の場合:
- フラグ生成行列は、マクロによって生成された行ではなく、ソース データ行であることを示す "False" を読み取ります。
- [日付列] 列は、適切な期間に "丸" されます。 下の丸めセクションを参照してください。
- 他のすべてのソース列は変更されずに通過します。
空白を埋めるために生成された行の場合:
- フラグ生成行列は、ソース データ行ではなく、マクロによって生成された行であることを示す "True" を読み取ります。
- [yourDateTimeColumn] 列には、一連の列で指定されたギャップを埋めるマクロによって生成された日付または日付時刻の値が設定されています。
- その他の列はすべて null です。
期間の開始/終了
最も一般的なビジネス使用シナリオごとに、時系列の期間は次のように処理されます。
- 「時間レベル」:間隔
- "日付レベル": 間隔 >= 日の場合、期間は "期間終了" です。
日時 "丸め"
マクロが入力データに対して行う唯一の変更は、[yourDateTimeColumn] に "丸め" が適用されます。 これは3つの重要な要素に基づいています。
- 間隔
- データ ストリームの最も早い日付/時刻の値
- インクリメント
まず、選択された間隔のすべての端数が切り捨てられます。 たとえば、間隔として [時間] を選択すると、マクロは日時の値から分と秒を切り捨てます。 午後1時58分は午後1時になります。
選択した間隔の端数を切り捨てた後、マクロは有効期間が何であるかを決定します。 マクロに入力する最も早い日付-時刻値は、系列の基礎となります。 上記の「時間シリーズ」の例を続けると、[yourDateTimeColumn] の最も早い日時が午後 1 時 58 分の場合、最初のピリオドは午後 1 時です。 選択した増分が 5 の場合、選択した増分値 (5 時間) を前の期間に連続的に加算した結果、午後 1 時、午後 6 時、午後 11 時などに続く期間が生成されます。
最後に、すべての有効な期間が決定された後、すべての日付/時刻値が適切な有効期間に調整されます。 したがって、[yourDateTimeColumn]の生の値は午後5時59分になり、午後6時2分は午後6時などになります。
期間 "ラベル"
マクロによってすべての日付時刻調整が適用された後、結果として得られる [yourDateTimeColumn] はその期間の実質的な "ラベル" になります。 ただし、データ型は (文字列ではなく) 日付または日付/時刻列であるため、この "label" は完全に直感的ではない可能性があります。 キーは、選択された間隔に対して「小数部」である日付または日付時刻の「ラベル」の任意の部分を無視する必要があることを認識することです。 したがって、区間が "year" の場合、例としてピリオドは "2018-01-01" になりますが、ラベルの重要な年はラベルの小数部分である "01-01" は無視する必要があります。 下の表を参照してください。
データの保存
上記の日付/時刻の「丸め」以外は、マクロは入力データを変更しないことに注意してください。 この機能は、受信データに対して結合、要約、一括、一括入力、またはあらゆる種類の検証を行いません。 ただし、日付の丸めのため、同じ期間内の複数の測定に同じ期間ラベルが付きます。 このように、データは今やよりクリーンになり、データはこの一貫性のある、丸められた期間ラベル「によりグループ化」できるためため、いつでもサマライズできるようになります。
夏時間
マクロは夏時間を考慮していないので、夏時間のカットオーバを超える時間レベルの時系列がある場合、マクロが無効な時間を表す1時間の行(または分の行)を生成する可能性があります。 たとえば、3 月に 1 時間の "春の前へ" の領域では、実際には発生しなかったにもかかわらず、春の午前 2 時の時刻に対して行が生成されます (時計は 1:59:59 から 3:00:00 に切り替わります)。 この時は、マクロの後のフィルタリングツールで簡単に削除できます。
ユースケースの例
明確にするために、次の表は、使用可能な間隔オプションと、返されるデータ型、およびその間隔タイプの期間が「期間開始」または「期間終了」の間隔のどちらであるかを示しています。 次に、系列の増分と「最初の生の値」の例を表示して、結果として生じる期間 "Label" が何であるか、およびピリオド ラベルが実際に何を意味するのかを説明します。 最後に、期間ラベルのどの部分を無視すべきかを表に示します。
間隔 | 返されるデータ型 | 期間の開始/終了 | 例のインクリメント | 最初の生の値の例 | 最初の期間レベルの結果 | 期間の説明 | 期間ラベルを無視する |
---|---|---|---|---|---|---|---|
分 | 日時 | 開始する | 2 | 2015/04/09 2:16:33 | 2015/04/09 2:16:00 | 「2:16から始まる2分間、2:16と2:17のすべてをカバー」 | 秒 |
時 | 日時 | 開始する | 4 | 2015/04/09 2:16:33 | 2015/04/09 2:00:00 | 「2、3、4、5時の全ての時間をカバーする2から始まる4時間の期間」 | 分以下 |
日 | 日付 | 終わり | 6 | 2015/04/09 2:16:33 | 2015-04-09 | 「4/9に終わる6日間は、4/4~4/9のすべてに及びます。」 | 時間以下 |
週 | 日付 | 終わり | 1 | 2015/04/09 2:16:33 | 2015-04-09 | 「4/9に終わる1週間は、4/3から4/9のすべてに及びます。」 | 時以下 |
月 | 日付 | 終わり | 3 | 2015/04/09 2:16:33 | 2015/04/01 | 「4月に終わる3月の期間は、2月、3月、4月のすべてに及びます。」 | 日数以下 |
年 | 日付 | 終わり | 2 | 2015/04/09 2:16:33 | 2015/04/01 | 「2014年に終わる2年間は、2014年と2015年のすべてに及びます。」 | 数ヶ月以下 |