Amazon Redshift Spectrum

Version:
Current
Last modified: April 02, 2020

接続に使用される Alteryx ツール

標準的なワークフロー処理

インデータベースワークフロー処理

Link
Blue icon with database being plugged in.

接続In-DBツール

ODBC 接続の構成

ODBC データソース管理者:

  1. Redshift ドライバーを選択し、設定をクリックします。
  2. 接続設定と資格情報を入力します。
  3. 追加オプション領域で、結果全体をメモリに取得オプションを選択します。
  4. OKをクリックして接続を保存します。

Amazon Redshift 一括接続の構成

データ出力ツールを使用して一括接続を使用するには:

  1. ファイルまたはデータベースへの書き込みドロップダウンまたはその他のデータベース > Amazon Redshift 一括を選択します。
  2. データソース名を選択します (またはODBC管理者をクリックして作成します)。参照: ODBCおよび OLEDB データベース接続
  3. (オプション)ユーザー名パスワードを入力します。
  4. Amazon S3セクションで、AWSアクセスキーAWSシークレットキーを入力または貼り付けて、アップロードするデータにアクセスします。
  5. シークレットキーの暗号化ドロップダウンで、暗号化オプションを選択します。
    • 非表示: 最小限の暗号化を使用してパスワードを非表示にします。
    • マシンの暗号化: コンピュータ上のすべてのユーザーが接続を最大限使用することができます。
    • ユーザーの暗号化: ログインしているユーザーは、どのコンピュータでも接続を使用できます。
  6. エンドポイントドロップダウンでDefaultを選択すると、選択したバケットに基づいて Amazon がエンドポイントを自動的に決定できます。プライベート S3 のデプロイメントのエンドポイントを指定する場合、または特定のバケット領域が分かっている場合は、エンドポイント(S3領域)を交互に選択する、カスタムエンドポイントを入力する、または以前に入力した 10 個のカスタムエンドポイントのうちの 1 つを選択することができます。

    選択したバケットが指定したエンドポイントの領域にない場合、次のエラーが発生します。「アクセスしようとしているバケットは、指定されたエンドポイントを使用して対処する必要があります。今後のリクエストをすべてこのエンドポイントに送信してください。」[Default] を選択してエラーを削除します。
  7. (オプション)デフォルトの署名V2の代わりに署名V4を使用するには、認証に署名V4を使用するを選択します。これによりセキュリティは向上しますが、接続速度が遅くなる場合があります。このオプションは、署名バージョン4が必要な地域では自動的に有効になります。
    • 署名V4が必要な地域:
      2014 年 1 月 30 日より後に作成された地域では、署名バージョン 4 のみがサポートされます。次の地域では、署名バージョン 4 の認証が必要です:
      • アメリカ東部(オハイオ)地域
      • カナダ(中央)地域
      • アジア太平洋(ムンバイ)地域
      • アジア太平洋(ソウル)地域
      • EU(フランクフルト)地域
      • EU(ロンドン)地域
      • 中国(北京)地域
  8. 暗号化された Amazon S3 バケットにアップロードするサーバー側暗号化方法を選択します。Amazon S3 暗号化方式の詳細については、Amazon Simple Storage Service 開発者ガイドを参照してください。
    • None (デフォルト): 暗号化方法は使用されていません。
    • SSE-KMS: AWS KMS で管理されたキーでサーバーサイドの暗号化を使用します。必要に応じて、KMSキーIDを指定します。この方法を選択すると、認証に署名V4を使用するがデフォルトで有効になります。
  9. バケット名で、データオブジェクトが格納されている AWS バケットの名前を入力します。

必要に応じて、Spectrum テーブルに接続するためのRedshift Spectrumを使用を選択します。

出力オプションを構成

オプションで、次の Redshift オプションを指定または調整できます。詳細については、Amazon Redshift データベース開発者ガイドを参照してください。

データ出力ツールを用いて Spectrum テーブルを作成するには、スキーマとターブル名の両方を指定します。

spectrum_schema.tablename

分散スタイルに「キー」が選択されていない場合、分散キーは無視されます。ソートスタイルで "なし" を選択すると、ソートキーは無視されます。

  • キー: 主キーの列を選択し、列の順序を調整します。
  • 分散スタイル: 偶数、キー、またはすべてを選択します。
  • 分散キー: 分散キーの列を選択します。
  • ソートスタイル: なし、複合、またはインターリーブを選択します。
  • ソートキー: ソートキーの列を選択し、列の順序を調整します。
  • バキューム処理と分析操作を有効にする: (一括接続のみ) デフォルトで有効になっています。有効にすると、VACUUM および ANALYZE 保守コマンドは、Redshift データベースへの一括ロード付加の後に実行されます。
  • 一括ロードチャンクのサイズ (1 MB ~ 102400 MB): アップロードのパフォーマンスを向上させるために、大きなファイルは、指定した整数サイズの小さいファイルに、メガバイト単位で分割されます。デフォルト値は 128 です。
  • バックスラッシュ (\) をエスケープ文字として有効にする: (一括接続のみ)既定で有効になっています。有効にすると、通常は特殊目的 (区切り文字、引用符、埋め込み改行文字、エスケープ文字など) で使用されていても、バックスラッシュ文字の直後にある文字は列データとして読み込まれます。

 

Was This Helpful?

Running into problems or issues with your Alteryx product? Visit the Alteryx Community or contact support.