Microsoft Azure Data Lake Store
Driver Details | 選択したログイン方法によっては、管理者は Alteryx Azure Data Lake ツールを使用して接続を行う前に、Azure Data Lake と Azure Active Directory へのアクセスを構成する必要があります。 |
Type of Support | 読み込みと書き込み |
バージョン | 説明 |
v2.2.0 |
|
v2.1.0 |
|
v2.0 |
|
v1.1.0 |
|
v1.0.2 |
|
v1.0.1 |
|
v1.0.0 |
|
接続に使用する Alteryx ツール
Azure Data Lake ツールを使用すると、Azure Data Lake Store リソースに接続し、データの読み取り / 書き込みを行うことができます。
Azure Data Lake (ADL) ファイル入力ツールを使用して、Azure Data Lake Store (ADLS) にあるファイルから Alteryx ワークフローにデータを読み取ります。
Alteryx ワークフローから ADL にあるファイルにデータを書き込むには、ADL ファイル出力ツールを使用します。
サポートされているファイル形式は、CSV 、XLSX 、JSON 、Avro です (付加アクションは CSV 形式でのみサポートされます)。
共有キーを除くすべてのツールは、Azure Active Directory エンドポイントに対して認証を行います。
認証と許可
Gen1 および Gen2 ストレージの Azure Data Lake エンドポイントは、認証中に接続するストレージの種類を指定する必要があります。使用しているストレージの種類がわからない場合は、Azure 管理者に問い合わせるか Microsoft Azure Portal で確認してください。
ヒント
- ワークフローをサーバーまたは AAH に発行するには、サービス間認証または共有キー認証タイプを使用します。そのため、トークンの更新が期限切れになった後でワークフローを再アップロードする必要はありません。
- メタデータのロードには時間がかかる場合があるため、詳細ユーザー設定 (オプション > ユーザー設定 > 編集ユーザー設定 > 詳細) で [自動設定の無効化] を選択すると、メタデータのロードを無効にできます。
Azure Data Lake Store アカウント内のデータの読み取りと書き込みの権限を付与しておく必要があります。これらのアクセス許可の割り当ておよび適用方法の詳細については、Microsoft の公式ドキュメントを参照してください。
シングルテナンシーとマルチテナンシー
シングルテナントアプリケーションは、登録したテナント (ホームテナントとも呼ばれます) でのみ使用できます。お客様または Azure 管理者は、Designer での認証時に使用するアカウントで、シングルテナント Azure アプリケーションとストレージを作成できます。マルチテナントアプリケーションは、ホームテナントと他のテナントの両方のユーザーが使用できます。
エンドユーザー (基本)
基本的なエンドユーザー認証は、Designer で ADL データにアクセスする最も便利な方法です。組織の Azure テナントでパブリック Alteryx アプリケーションを許可するには、Azure 管理者の支援が必要です。手順を説明する Microsoft のドキュメントを参照してください。
Tenant: common
ADLS Client ID for the Gen1 Alteryx application: 7fa1a397-27aa-40ad-b47c-a47fa9e600bd
ADLS Client ID for the Gen2 Alteryx application: 2584cace-63ff-47cb-96d2-d153704f4d75
このセットアップ後、ユーザーとその同僚は、通常の Microsoft 資格情報を使用して ADL データにアクセスできます。
エンドユーザー (上級)
高度なエンドユーザー認証は、シングルテナント認証とマルチテナント認証をサポートし、パブリックアプリケーションとプライベートアプリケーションの両方で使用できます。
資格情報の設定についてはMicrosoft のドキュメントで手順を参照してください。
認証の設定
- テナント ID: テナント ID は Azure ポータルから取得できます。または、テナント ID フィールドに「common」と入力して Azure の自動検出メカニズムを利用できます。複数のテナントにアクセスする場合は、テナント ID を指定できます。マルチテナンシーの詳細については、「シングルテナンシーとマルチテナンシー」セクションを参照してください。
- クライアント ID: Azure アプリケーションの一意の ID です。クライアント ID フィールドは必須です。
- クライアントシークレット: アプリケーションがプライベートの場合は、クライアントシークレットを指定する必要があります。パブリックアプリケーションを使用している場合は、フィールドは空白のままにします。
サービス間
サービス間認証は、サーバーおよびハブでワークフローを発行するのに適しています。
資格情報の設定についてはMicrosoft のドキュメントで手順を参照してください。
共有キー
- 共有キー認証は、Gen2 ストレージでのみ使用できます。
- サーバーへの公開は、Designer および Server 2020.4 以降のバージョンでのみ機能します。これは、この認証方式が 2020.4 リリース以降で導入されたためです。
Azure ストレージアカウントを使用すると、マイクロソフトは 2 つのアクセスキーを生成します。これらのアクセスキーを使用して、共有キーの承認を介した Azure Data Lake へのアクセスを承認できます。共有キーとその使用方法の詳細については、Microsoft のドキュメントを参照してください。
Azure National Clouds とカスタムエンドポイント
v2.0 リリース以降、 ADL コネクタはカスタムエンドポイントへのアクセスをサポートしています。米国および中国の国のクラウドの URL は、認証局エンドポイントフィールドのコネクタの認証画面で選択できます。
アプリケーションのセットアップ
ファイルストレージには、登録されたアプリケーションを使用してアクセスします。アプリケーション登録は、エンドユーザー (基本) と共有キーを除くすべての認証タイプに必要です。Azure Portal にアプリケーションを登録するにはMicrosoft のドキュメントポータルにある手順を参照してください。
Alteryx Designer で Microsoft Azure アプリケーションを使用する
- Designer キャンバスに Azure Data Lake 入力または Azure Data Lake 出力を追加します。
- ツールを選択すると、右側に設定パネルが表示されます。
- 認証データに http://portal.azure.com/ で入手可能なデータを入力します。Azure Portal の操作方法については、Microsoft のドキュメントを参照してください。
- ディレクトリ ID (テナント) とアプリケーション ID (クライアント) を Designer にコピーする
- (オプション) Azure Data Lake Gen1 ストレージに接続する場合は、[Gen1 の使用] を選択します。
- サービス間モードで接続する場合は、[クライアントシークレット] を貼り付けます。
- 接続 を選択します。
データの選択と構成のオプション
[データ] タブでは、使用するデータを指定できます。
- ストレージアカウント名を指定します。このストレージは、認証ページで選択したものと同じタイプ (Gen1、Gen2) である必要があります。
- Gen2 ストレージの場合は、ファイルシステム名を指定します。
- Gen2 のストレージとファイルシステムを選択したら、読み書きするファイルのパスを設定できます。パスは、[ファイルパス] フィールドに直接入力するか、ファイルブラウザーを使用して指定できます。Azure Data Lake ファイル出力ツールでは、同じメカニズムを使用して新しいファイルを作成できます。
- Excel ファイルの場合、シート名はファイルブラウザーの下にある [シート] フィールドで指定できます。空の場合、最初のシートが自動で選択されます。新しいファイルの場合、シートにはデフォルト名「Sheet」が付けられます。
ファイル形式と設定
ADL ツールは、 .csv、 .Avro、 .json、 .xlsx のデータ形式をサポートしています。
- CSV ファイル
- 読み込み
- 書き込み: 既存の CSV ファイルを上書きまたは追加できます。
ヒント
入力および出力データツールとの互換性を保つために、エンコーディングは UTF-8 SIG にする必要があります。
- JSON ファイル
- 読み取り: JSON ファイルを正しく読み取るには、BOM なしの UTF-8 エンコーディングを使用する必要があります。
- 書き込み: JSON ファイルへの書き込み時のデータ型変換には、Decimal、DateTime 、Time セルが文字列として出力されるという制限があります。
- Avro ファイル
- 読み込み
- 書き込み
- Excel ファイル
- 読み取り: すべてのデータは V_Wstrings として読み取られます。
- 書き込み
追加の詳細
- 別のアカウントで作成された特定のフォルダーへのアクセス権 (読み取り / 書き込み) がない状態の場合、これはアクセス権が原因です。
- トークンが取り消された可能性があることを示すエラーが発生した場合は、ログアウトしてから設定パネルに戻って再認証を行う必要があります。
トークンの有効期間のプロパティは、システム管理者が設定できます。
Azure Data Lake Explorer は、Azure Data Lake Store アカウント内のデータの読み取りと書き込みの権限を付与する必要があります。これらのアクセス許可の割り当ておよび適用方法の詳細については、Microsoft の公式ドキュメントを参照してください。
制限
JSON と Avro は UTF-8 のみです。
JSON の場合、データ型に大きすぎる数値を格納しようとすると、サイレント変換エラーが発生します。
Excel ファイルへの書き込みは、現在、完全なファイル上書きのみに制限されています。
バイトタイプのフィールドを持つ Avro ファイルはサポートされていないため、インポート時に失敗します。
Alteryx ワークフローの float フィールド値は、宛先 Avro ファイルでは double に変換されます。
Microsoft Azure Data Lake、 OneDrive、Dynamics CRM コネクタは、メールやパスワードなどの Microsoft ユーザー資格情報による認証をサポートしています。対話型ワークフローでは、現在、これらのコネクタ間で異なる Microsoft ユーザーアカウントで認証を行うことはできません。この制限は、スケジュールされたワークフローには影響しません。これらのコネクタのいずれかで Microsoft ユーザーアカウントで認証され、別の Microsoft ユーザーアカウントで別のコネクタへの認証を試みると、エラーメッセージがポップアップ表示されます。この問題を解決するには、次の推奨事項のいずれかに従います。
- Azure Active Directory 管理者は、必要な権限を 1 つのユーザーアカウントに付与し、ワークフローを構築するユーザーが、そのワークフローで必要なサービスにアクセスできる 1 つのユーザーアカウントを持つようにすることができます。
- 別の Microsoft ユーザーアカウントに認証されているコネクタからログアウトしてから、ログインします。
- 可能な場合は、エンドユーザー認証を使用しないでください。Azure Data Lake コネクタではサービス間認証を、Dynamics CRM コネクタではアプリケーションログイン認証を使用します。
Desktop Automation (Scheduler) is not supported by this connector.