Amazon Redshift
バージョン:
2023.1
Last modified: August 05, 2021
Type of Support | 読み込みと書き込み (インデータベース) |
Validated On | データベースバージョン: 1.0.23412 |
ドライバーの詳細
書き込み専用のバルクロードのサポートは、標準およびIn-DBワークフローで使用できます。インデータベース処理には、64ビットのデータベースドライバが必要です。外部プロバイダーから ODBC ドライバーをダウンロードするには、AWS アカウントを作成する必要があります。
Simba Amazon Redshift ODBC ドライバーの詳細については、Simba ポータルの インストールと設定ガイド を参照してください。
接続に使用する Alteryx ツール
標準的なワークフロー処理
ODBC 接続の設定
ODBC データ ソース アドミニストレーターで...
- Redshift ドライバーを選択し、設定 を選択します。
- 接続 設定 と資格情報を入力します。
- 追加オプション領域で、結果全体をメモリに取得オプションを選択します。
この設定では、データセット全体が物理メモリにフェッチされます。物理メモリの容量が少ない場合は、データボリュームと使用可能な物理メモリの量に基づいて設定が変更される可能性があります。推奨の設定にするには、DBA を関与させる必要がある場合があります。
- OK を選択して、接続を保存します。
Amazon Redshiftバルク接続を構成する
データ出力ツールを使用してバルク接続を使用するには...
- ファイルまたはデータベースへの書き込み のドロップダウンを選択して、その他のデータベース > Amazon Redshift バルク を選択します。
- データソース名 を選択します (または、ODBC Admin を選択して、1 つ作成します)。参照: ODBC / OLEDB データベース接続
- (オプション) ユーザー名 と パスワード を入力します。
- Amazon S3 セクションで、AWSアクセスキー と AWSシークレットキー を入力または貼り付けて、アップロードするデータにアクセスします。
- シークレットキーの暗号化 のドロップダウンで、暗号化オプションを選択します。
- 非表示: 最小限の暗号化を使用してパスワードを非表示にします。
- マシンの暗号化: コンピューター上のすべてのユーザーが接続を最大限使用することができます。
- ユーザーの暗号化: サインインしているユーザーは、どのコンピューターでも接続を使用できます。
- エンドポイント のドロップダウンで Default を選択すると、選択したバケットに基づいて Amazon がエンドポイントを自動的に決定します。プライベート S3 のデプロイメントのエンドポイントを指定する場合、または特定のバケット領域が分かっている場合は、エンドポイント (S3領域) を交互に選択する、カスタムエンドポイントを入力する、または以前に入力した 10 個のカスタムエンドポイントのうちの 1 つを選択することができます。
選択したバケットが指定したエンドポイントの領域にない場合、次のエラーが発生します。「アクセスしようとしているバケットは、指定されたエンドポイントを使用してアドレス指定する必要があります。今後のすべてのリクエストはこのエンドポイントに送信してください。」 Default を選択してエラーを消去します。
- デフォルトの署名 V2 の代わりに署名 V4 を使用するには、認証に署名V4を使用するを選択します (オプション)。これによりセキュリティは向上しますが、接続速度が遅くなる場合があります。このオプションは、署名 V4 が必要なリージョンでは自動的に有効になります。
署名バージョン 4 が必要な地域: 2014 年 1 月 30 日以降に作成された地域では、署名バージョン 4 のみがサポートされます。次の地域では、署名バージョン 4 認証が必要です。- アメリカ東部 (オハイオ) 地域
- カナダ (中央) 地域
- アジア太平洋 (ムンバイ) 地域
- アジア太平洋 (ソウル) 地域
- EU (フランクフルト) 地域
- EU (ロンドン) 地域
- 中国 (北京) 地域
- 暗号化された Amazon S3 バケットにアップロードするサーバー側の暗号化方法を選択します。Amazon S3 暗号化方式の詳細については、Amazon Simple Storage Service 開発者ガイド を参照してください。
- None (デフォルト): 暗号化方法は使用されていません。
- SSE-KMS: AWS KMS で管理されたキーでサーバーサイドの暗号化を使用します。必要に応じて、KMSキーIDを指定します。この方法を選択すると、認証に署名V4を使用するがデフォルトで有効になります。
- バケット名 で、データオブジェクトが格納されている AWS バケットの名前を入力します。
必要に応じて、Spectrum テーブルに接続するための Redshift Spectrumを使用するを選択します。
出力オプションの設定
オプションで、次の Redshift オプションを指定または調整できます。詳細については、Amazon Redshift データベース開発者ガイド を参照してください。
データ出力ツールを用いてSpectrumテーブルを作成するには、スキーマとターブル名の両方を指定します。
spectrum_schema.tablename
分散スタイルに 「キー」が選択されていない場合、分散キーは無視されます。[ソートスタイル]で[なし]を選択すると、ソートキーは無視されます。
- プライマリキー: プライマリキーの列を選択し、列の順序を調整します。
- 配布スタイル: 偶数、キー、または すべて を選択します。
- 分散キー: 分散キーの列を選択します。
- ソートスタイル: なし、複合、または インターリーブ を選択します。
- ソートキー: ソートキーの列を選択し、列の順序を調整します。
- バキューム処理と分析操作を有効にする: (バルク接続のみ) デフォルトで有効になっています。有効にすると、VACUUM および ANALYZE 保守コマンドは、Redshift データベースへのバルクロード付加の後に実行されます。
- バルクロードチャンクのサイズ (1 MB ~ 102400 MB): アップロードのパフォーマンスを向上させるために、大きなファイルは、指定した整数サイズの小さいファイルに、メガバイト単位で分割されます。デフォルト値は128です。
- バックスラッシュ (\) をエスケープ文字として有効にする: (バルク接続のみ) 既定で有効になっています。有効にすると、通常は特殊目的(区切り文字、引用符、埋め込み改行文字、エスケープ文字など)で使用されていても、バックスラッシュ文字の直後にある文字は列データとして読み込まれます。