Skip to main content

集計ツール

集計ツールを使用して、データに対してさまざまなアクション(関数と計算)を実行します。

集計ツールを使ってできることは以下の通りです。

  • データの列の合計を返します。合計は、列のすべての行を加算することで計算されます。

  • 列の最小値または最大値を返します。

  • 列の行数をカウントします。

  • データの列を同一の値ごとにグループ化します。

  • 文字列の値を連結します。

  • さまざまな数学的計算を実行します。

集計方法の完全なリストは、集計アクション を参照してください。

ヒント

このツールには「ツールごとに学習」があります。サンプルワークフローへのアクセス を参照して、Designer Cloud でこのサンプルやその他の多くのサンプルに直接アクセスする方法を確認してください。

ツールコンポーネント

Summarize_Tool_Anchors.png

図: 2つのアンカーのある集計ツール

集計ツールには2つのアンカーがあります。

  • 入力アンカー: 入力アンカーは、アクションを実行するデータに接続します。

  • 出力アンカー: 出力アンカーには、アクションの結果のみが表示されます。結合ツール を使用して、集計ツールの結果を元のデータに結合します。

ツールの設定

集計ツール設定ウィンドウには3つのセクションがあります。

アクションを追加する列を選択します

入力のデータ列の名前と、それらに関連付けられている サポートされているデータ型 がテーブルに表示されます。

  1. アクションを実行する列を選択します。Shiftキーを押しながら複数の列を選択して、同じアクションを実行します。フィルターアイコンを使用して一括選択を行うことができます。選択肢には、次のものが含まれます。

    • すべて: すべての列を選択します。

    • なし: 列を選択しません。以前に選択したフィールドは選択解除されます。

    • 数値: 数値データ型の列のみが選択されます(整数、固定小数点数、浮動小数点数、倍精度浮動小数点数)。

    • 文字列: 文字列データ型の列のみが選択されます。

    ヒント

    各列ヘッダーを選択して列名またはタイプで並び替えます。

  2. 列を選択した状態で、[+アクションを追加]を選択します。さまざまなアクションから選択できます。選択した サポートされているデータ型 と互換性がない場合、アクションは使用できません。

  3. 実行するアクションを選択します。アクションが アクション セクションに追加されます。

1つの列に対して複数のアクションを実行することもできます。これを行うには、実行するアクションごとに列を選択して追加します。

アクション

アクション セクションには、前のセクションで追加したデータ列が含まれます。アクション セクションに列を追加すると、次のオプションを使用できます。

  • 並べ替え: 並べ替えアイコンを選択したまま、アクションをリスト内の目的の場所にドラッグするか、列を選択し、上下の矢印アイコンを使用して列の順序を変更します。これにより、結果グリッドのツール出力の列の順序も更新されます。

  • 削除: 列を選択し、ゴミ箱アイコンを使用してアクションを削除します。

  • アクションの変更: アクションを変更するには、[アクション]列のドロップダウンを選択し、互換性のあるアクションを選択します。

  • 出力する列ヘッダーの名前を変更: 出力する列の名前を変更するには、列を選択し、出力名 に新しい名前を入力します。

パラメーター

一部のアクションでは、追加のパラメーターを指定する必要があります。

  • 追加のパラメーターが必要な場合は、ツールの設定ウィンドウの下部にある[パラメーター]セクションで指定します。特定のパラメーターについては、「集計アクション」を参照してください。

  • 追加のパラメーターが不要な場合は、[パラメーター] セクションは使用できません。

集計アクション

次の一覧では、集計ツールで実行できるアクションの種類について説明します。

  • グループ化: 指定した列の値が同一のデータベース行を単一の行に結合します。グループ内の行に由来するすべてのデータが集計されます。BLOB 型または空間オブジェクト型以外には、このオプションがあります。グループ化 する列が指定されていない場合、ファイル全体が集計されます。

  • 合計: グループの合計値を返します。合計は、グループのすべての値を加算することで計算されます。

  • カウント: グループ内の行の数を返します。

  • 非Nullのカウント: カウント と同じですが、この場合、Null 以外 の行のみをカウントします。Nullは、行に値が設定されていないことを意味します。これはゼロまたは空の文字列とは異なります。

  • 重複を除いてカウント: グループ内のユニークな行の数を返します。

  • 非Nullを重複を除いてカウント: 重複を除いてカウント と同じですが、この場合、Null 以外 の行の数のみがカウントされます。Nullは、この行に値が設定されていないことを意味します。これはゼロまたは空の文字列とは異なります。

  • Nullをカウント: このアクションは カウント と同じですが、この場合、Nullである行のみがカウントされます。Nullは、行に値が設定されていないことを意味します。これはゼロまたは空の文字列とは異なります。

  • 最小: 最小値を返します。

  • 最大: 最大値を返します。

  • 最初: レコード位置に基づいて、グループ内の最初のレコードを返します。

  • 最後: レコード位置に基づいて、グループ内の最後のレコードを返します。

ファイナンス

  • 正味現在価値 (NPV): グループの正味現在価値を計算します。資金調達費用が満たされた時点で、現在の価値でキャッシュフローの超過または不足を測定します。NPVプロパティ には、次のものが含まれます。

    • 割引率 (期間ごと): 割引率 (パーセント)既定値は 8% です。

  • 定期的でない投資の正味現在価値(XNPV): 一連の日付のグループの正味現在価値を計算します。XNPVプロパティ には、次のものが含まれます。

    • 融資利率: 融資利率をパーセンテージで表示します。既定値は 8% です。

    • 日付列: 関連付けられた日付を含む列。

  • 内部収益率(IRR): グループの内部収益率を計算します。投資の内部収益率は、投資額が将来得られる投資の利益につながる収益率を指します。これは、投資から得られるすべての利益は金銭の時間的価値に固有であり、投資がこの利益でゼロの正味現在価値を持つことを意味します。

  • 定期的でない投資の内部収益率(XIRR): 一連の日付のグループに対する内部収益率を計算します。XIRR プロパティ には、次のものが含まれます。

    • 日付列: 関連付けられた日付を含む列。

  • 修正内部収益率 (MIRR): 内部収益率の修正と、IRR に関するいくつかの問題を解決することを目的としています。MIRRは、投資の魅力度の金融尺度です。MIRR プロパティ には、次のものが含まれます。

    • 融資利率: 融資率をパーセンテージで表示します。既定値は 8% です。

    • 再投資率: 再投資率をパーセンテージで表示します。既定値は 8% です。

  • 定期的でない投資の修正内部収益率(MXIRR): 一連の日付のグループに対する修正内部収益率を計算します。MXIRR プロパティ には次のものが含まれます。

    • 融資利率: 融資率をパーセンテージで表示します。既定値は 8% です。

    • 再投資率: 再投資率をパーセンテージで表示します。既定値は 8% です。

    • 日付列: 関連付けられた日付を含む列。

数値

  • 平均: グループの平均値を計算します。平均は、すべての値の合計を値の総数で割って計算されます。

  • 総乗(Product): グループの積を計算します。この総乗(Product)は、指定されたグループ内のすべての数値を乗算して計算されます。

  • パーセンタイル: グループの指定したパーセンタイル値を計算します。パーセンタイルは、データを並べ替え、指定されたパーセンタイルと並べ替えた配列内でその位置にある行の値を返して計算されます。最大値は100パーセンタイル、最小値は0パーセンタイル、中央値は50パーセンタイルで、25パーセンタイルは中央値と最小値の中間の値です。パーセンタイルプロパティには、以下が含まれます。

    • パーセンタイル: 返すパーセンタイルを指定します。既定値は50%です。

  • 中央値: グループの中央値を計算します。グループの中央値は、値が順番に並べ替えられる場合の中央値です。偶数の値がある場合、中央に数値が存在しないため、中央の2つの数値が平均されます。

  • 最頻値: グループの最頻値を計算します。一連の数の最頻値は、値のグループで最も頻繁に発生する最小の数値です。すべての値が固有である場合は、最小の数値が返されます。

  • 標準偏差: グループの標準偏差を計算します。標準偏差は、統計で使用される測定のばらつきです。

  • 分散: グループの分散を計算します。分散は標準偏差を取得し、標準偏差の二乗平均の正の平方根を取って計算されます(StdDev2)。

  • 平均 - 0を無視: 0の値を含むレコードを無視して、上で説明した平均を計算します。

  • パーセンタイル - 0を無視: 0の値を含むレコードを無視して、上で説明したパーセンタイルを計算します。

  • 中央値 - 0を無視: 0の値を含むレコードを無視して、上で説明した中央値を計算します。

  • 最頻値 - 0を無視: 0の値を含むレコードを無視して、上で説明した最頻値を計算します。

  • 標準偏差 - 0を無視: 0の値を含むレコードを無視して、上で説明した標準偏差を計算します。

  • 分散 - 0を無視: 0の値を含むレコードを無視して、上で説明した分散を計算します。

文字列

  • 空白をカウント: 空白または空の値を持つグループ内の行数をカウントします。

  • 空白以外をカウント: 空白または空の値を持たないグループ内の行数をカウントします。

  • 連結: グループ内のすべての行を取得し、文字列の連結を行います。連結プロパティ には、次のものがあります。

    • 開始: 指定された文字は、連結された文字列の先頭に表示されます。既定では空白のままです。

    • 区切り記号: 指定された文字は、連結文字列の各値の間に表示されます。既定はコンマです。

    • 終了: 指定された文字は、連結された文字列の末尾に表示されます。既定では空白のままです。

  • 最長: グループの最長文字列値を返します。

  • 最頻値: 文字列値の最頻値を返します。一連の文字列値の最頻値は、値のグループで最も頻繁に発生する最小の文字列です。すべての値が固有である場合は、最小の文字列が返されます。最小文字列は、昇順のソート順で最初の文字列です。

  • 最短: グループの最短文字列値を返します。