
特徴量構築
特徴量構築ツールを使用して、特徴量を作成し、別々のテーブルに含まれているデータ間の関係を確立します。このツールでは、primitives (基本データ型) を使用して、指定したデータから特徴量を構築します。
このツールは Alteryx Intelligence Suite の一部です。Intelligence Suite を使用するには、Designer に加え、ライセンスと追加インストーラーが別途必要です。Designer をインストール後、Intelligence Suite をインストールし、無料トライアルを開始 します。
ツールコンポーネント
特徴量構築ツールには 2 つのアンカーがあります。
- 入力アンカー: 入力アンカーは、特徴量を構築したいデータストリームに接続します。入力アンカーの 2 つの山かっこは、複数の入力を受け入れることを示します。
- 出力アンカー: 出力アンカーを使用して、構築した特徴量を含むデータをダウンストリームに渡します。
ツールの設定
特徴量構築ツールを使用するには、データ間の関係を管理するオプションを設定し、データから特徴量を構築するプリミティブを管理する必要があります。
1. 関係性の管理
- 関係性の管理 タブを選択します。このセクションは、設定ウィンドウを初めて開いたときに既定で表示されます。
- ターゲットテーブル を選択します。
- ドロップダウンから 主キー を選択します。ターゲットテーブルの主キーを選択するだけで済みますが、作成したい関係の数によっては、他のテーブルの主キーを選択すると関係を作成しやすくなる場合があります。
- データ内でテーブル間の親子関係を定義します。親 テーブルとその キー、子 テーブルとその キー を選択します。
- 複数の親子関係を追加したい場合は、新しい関係 を選択します。
2. primitives (基本データ型)の管理
- 必要なすべての関係を作成したら、プリミティブの管理 タブに移動します。
- データから構築したいプリミティブを 検索 します。プリミティブとその説明のリストを表示するには、こちらのページ を参照してください。
- primitives (基本データ型) の横にあるチェックボックスをオンにします。
- テーブルの深さ を選択し、集約プリミティブを使用する際に、ツールが確認するテーブルの数を指定します。このタイプのprimitives (基本データ型) は、複数のテーブルからデータを結合または集約して特徴量を構築します。
primitives (基本データ型)について
大まかに言えば、primitives (基本データ型)とは、特徴量を構築するのに役立つ生データに適用される関数のことです。こうした関数で、データを集約または変換して特徴量を構築できます。primitives (基本データ型)はデータの入力と出力のみを制約するため、さまざまなシナリオで同じ特徴量を適用できます。例えば、1 つのprimitives (基本データ型)で 2 つの日付の間の平均時間を測定します。このprimitives (基本データ型)は、学期、季節、または在職の期間を測定するなど、さまざまなシナリオで適用できます。このように、1 つのprimitives (基本データ型)をさまざまなコンテキストで使用して、データに関するさまざまな質問に答えることができます。primitives (基本データ型)の動作の詳細については、こちらのページ を参照してください。