Google BigQuery
サポートのタイプ: | 読み込み&書き込み |
検証済み: | -- |
接続タイプ: | Alteryxツール |
ドライバの詳細: | Alteryx で接続を構成する前に、Google クラウドプラットフォームでの管理者の操作が必要になる場合があります。 Google BigQuery ツール。 |
接続に使用されるAlteryxツール
ウィンドウを Google BigQuery 入力ツール テーブルをクエリするには Google BigQuery そして、それをDesignerに読み込むには。 を参照してください Google BigQuery 既知の制限事項について説明します。 に関する詳細情報 Google BigQuery で見つけることができます Google Big Queryのドキュメント サイト。
ギャラリーツール
このツールはDesignerでは自動的にインストールされません。 このツールを使用するには、Alteryx Analytics Galleryからダウンロードしてください。
にログインできます。 Google BigQuery サービス間またはエンドユーザーの資格情報を使用します。
サービスアカウントの JSON キーファイルは、Google クラウドコンソールから取得することも、既存のサービスアカウント用に新しいキーを作成することもできます。 に関する詳細情報 Google BigQuery で見つけることができます Google Big Queryのドキュメント サイト [サービスアカウントキーの作成と管理] の下にあります。
- [認証モード] で、[サービス間] を選択します。
- [ファイルの選択] をクリックして、Google サービスアカウントファイルを選択します。
- [ファイルを開く] で、Google サービスアカウントキーを含む JSON ファイルを閲覧して選択します。
- 認証モードで、[エンドユーザー] を選択します。
- クライアント IDとクライアントシークレットを入力します。
- [ログイン] をクリックします。
- google にログインして、google Eメールとパスワードを入力し、コネクタのアクセス許可のための[許可] をクリックします。 Google BigQuery お客様に代わって。
- 次へ をクリックします。
- BigQuery テーブル入力設定で、[テーブルの選択] をクリックします。
Designer アクセス可能なテーブルが表示されます。
- プロジェクトを選択し、データセットを展開して、BigQuery テーブルを選択します。 テーブルを選択すると、Designerテーブルの完全修飾識別子が表示されます。 メタデータを更新するには、[更新] アイコンをクリックします。[テーブルの変更] をクリックして別のテーブルを選択
-
オプションを選択します。
- 返される結果の数を制限する: 返されるレポートの行数を設定します。
- カスタムクエリを使用する: SQL の種類を選択し、 クエリするプロジェクトを選択します。 任意の LIMIT 句を含むカスタムクエリを入力します。
- 最大反復レコード制限を推測: カスタムクエリでは使用できません。 このオプションを選択し、[最大フィールド長] をクリックして、反復レコード制限を、テーブルから返された結果の反復レコードの最大数に設定します。 Google BigQuery レコード数を制限する場合は、Designerレコードのセットのみを検査して、最大反復レコード制限を推測します。
- ワークフローを実行します。
ウィンドウを Google BigQuery 出力ツール Designerでテーブルにデータを書き込むには Google BigQuery。 を参照してください Google BigQuery 既知の制限事項について説明します。 に関する詳細情報 Google BigQuery で見つけることができます Google Big Queryのドキュメント サイト。
ギャラリーツール
このツールはDesignerでは自動的にインストールされません。 このツールを使用するには、Alteryx Analytics Galleryからダウンロードしてください。
にログインできます。 Google BigQuery サービス間またはエンドユーザーの資格情報を使用します。
サービスアカウントの JSON キーファイルは、Google クラウドコンソールから取得することも、既存のサービスアカウント用に新しいキーを作成することもできます。 に関する詳細情報 Google BigQuery で見つけることができます Google Big Queryのドキュメント サイト [サービスアカウントキーの作成と管理] の下にあります。
- [認証モード] で、[サービス間] を選択します。
- [ファイルの選択] をクリックして、Google サービスアカウントファイルを選択します。
- [ファイルを開く] で、Google サービスアカウントキーを含む JSON ファイルを閲覧して選択します。
- 認証モードで、[エンドユーザー] を選択します。
- クライアント IDとクライアントシークレットを入力します。
- [ログイン] をクリックします。
- google にログインして、google Eメールとパスワードを入力し、コネクタのアクセス許可のための[許可] をクリックします。 Google BigQuery お客様に代わって。
- 次へ をクリックします。
- BigQuery テーブル入力設定で、[テーブルの選択] をクリックします。
- プロジェクトを選択し、データセットを展開して、BigQuery テーブルを選択します。 Designer アクセス可能なテーブルが表示されます。 メタデータを更新するには、[更新] アイコンをクリックします。テーブルを選択すると、Designerテーブルの完全修飾識別子が表示されます。 [テーブルの変更] をクリックして別のテーブルを選択
-
[バッチサイズの挿入] で、バッチサイズを選択します。 この数値は、insert API の各呼び出しのテーブルに Google BigQuery 書き込む行の数を指定します。 Google では、1秒あたりの API リクエスト数、1秒あたりおよびリクエストごとに挿入可能な行数、挿入される行のサイズ、および HTTP リクエストのサイズに制限を設定しています。
制限と割り当ての詳細については、Google BigQuery のクォータ割り当てと制限のドキュメントサイトを参照してください。 また、ストリーミングデータを BigQuery ドキュメントにレビューして、データがどのようにテーブルに挿入されるかを Google BigQuery 理解することもできます。
- ワークフローを実行する
認証とアクセス許可
認証情報については、Google クラウド管理者に Google BigQuery お問い合わせください。
サービス間認証のセットアップ
サービスアカウントの JSON キーファイルは、Google クラウドコンソールから取得することも、既存のサービスアカウント用に新しいキーを作成することもできます。 に関する詳細情報 Google BigQuery で見つけることができます Google Big Queryのドキュメント サイト [サービスアカウントキーの作成と管理] の下にあります。
エンドユーザー認証のセットアップ
Google クラウドコンソールの [資格情報] ページから OAuth クライアント ID とシークレットを取得します。 クライアントの種類が [その他] に設定されていることを確認します。
アクセス許可
内のデータを読み書きする権限 Google BigQuery プロジェクトサービスアカウントは、Google クラウドコンソールから付与する必要があります。 アクセス許可の詳細については、Google Big Queryのドキュメント サイトです。
既知の制限
フロート BigQuery フィールド
BigQuery テーブルの FLOAT 型フィールドは、Alteryx エンジンの double 型に自動的に昇格されます。 したがって、入力された値の中に余分な小数点以下が表示され Google BigQuery。
ネストされた最大値、繰り返し記録深度
ネストされた繰り返しレコードは、1レベルの深度でサポートします。 Nexted repated 複数のレベルのディープネストされたレコードはサポートされていません。 ネストされた、繰り返されるレコードの詳細については、Google BigQuery のドキュメントサイトを参照してください。
ネストされた、繰り返されるレコードの平坦化
ネストまたは繰り返されたレコードを Google BigQuery テーブルでは、Alteryx ワークフローは、次の命名スキームに従って nexted または繰り返されるレコードを平坦化します。
最上位の列 top_attr のネストされたレコード nested_attr は、 nr_top_attr_nexted_attr という名前の新しい列を作成 します。
Alteryx ワークフローのレコードを既存の Google BigQuery テーブルでは、レコードフィールドをネストされたレコードまたは繰り返し記録に分割する必要がある場合は、出力コネクタに流れるレコードフィールドの名前を変更して、これらの命名規則に従ってください。
トップレベルの列 top_attr にネストする必要があるレコード nested_attr は、 nr_top_attr_nested_attr に名前を変更する必要があります。
トップレベルの列 top_attr の下で任意の回数をネストして繰り返さなければならないレコード nested_attr は、nrr_top_attr_ {repetition_index} _nested_attr に名前を変更する必要があります。 入れ子になったフィールドのすべての NULL 値を含む繰り返しは 、API 呼び出しの前に削除され、新しい行を Google BigQuery 表これは、デザイナーワークフローのレコードが任意の数の最大繰り返しを持つことができることを意味し、すべてのレコードの繰り返し回数が同じである必要はありません。
出力コネクタスキーマ
に渡されるフィールド名と型 Google BigQuery 出力ツール 目的地のものと一致しなければならない Google BigQuery テーブル。 に存在する列 Google BigQuery テーブルが、ワークフローフィールドリストに存在しない場合は、挿入されたレコードの列に Null 値が生成します。 これにより、変換先列が null 許容として構成されていない場合にエラーが発生します。
入力進行状況インジケーター
カスタムクエリを使用せずに、入力ツールの選択されたテーブルのストリーミングバッファに行がある場合、入力ツールは、進行状況インジケーターのパーセンテージを更新しながら、Google が報告したストリーミングバッファ内の行数の推定値を使います。実行中のワークフロー。 Google の見積もりが正しくない場合は、進行状況インジケーターに報告された値も正しくない可能性があります。
クエリ対象のテーブルが空で、そのテーブルのストリーミングバッファが空でない場合、Google ではストリーミングバッファ内の行数をゼロとして見積もることができます。 ただし、Google では、ストリーミングバッファから行を返す場合もあります。 この現象が発生すると、進捗状況インジケーターのパーセンテージの更新が表示されず、警告がヲされます。