Microsoft Azure Data Lake Store

バージョン:
2023.1
Last modified: August 26, 2022
Driver Details

選択したログイン方法によっては、管理者は Alteryx Azure Data Lake ツールを使用して接続を行う前に、Azure Data Lake と Azure Active Directory へのアクセスを構成する必要があります。

Type of Support

読み込みと書き込み

リリースノート
バージョン 説明
v2.2.0
  • 出力でカスタム CSV 区切り文字を指定できます。

  • XXE の潜在的な脆弱性を修正しました。
v2.1.0
  • 改善された新しいユーザーインターフェイスです。
  • マイナーな問題を修正しました。
  • Alteryx Designer バージョン 2021.2 以降と互換性があります。
v2.0
  • UI のアップグレードとエラー処理の改善を行いました
  • Gen2 ストレージのサポートが追加されました
  • Azure Government、China Cloud、カスタムエンドポイントのサポートが追加されました
  • 共有キー認証サポート
  • パブリックアプリケーションのサポート (独自および Alteryx)
  • マルチテナンシーサポート
  • Excel の入出力サポート
  • カスタム区切り記号を使用して.csv ファイルの読み取りと書き込みを行う機能が追加されました
  • Alteryx Designer バージョン 2019.3 以降と互換性があります。
v1.1.0
  • エンドユーザー認証エラーが修正されました
  • エンドユーザー認証のリダイレクト URI を指定できるようにしました
v1.0.2
  • コードページのオプションを更新しました。

  • 同じ言語のエンコーディング (たとえば、「言語」 -> 「言語 (特定のコード)」) を区別して、エンコーディングをアルファベット順に並べました。

  • 出力ツールで CSV ファイルのエンコーディングを指定できるようにしました。

  • 無効なストア名が提供されたことを示すエラーメッセージが改善されました。

  • データ変換処理が改善され、フィールドに値がないときにエラーではなく警告がスローされるようになりました。

  • ユーザーがストア名を変更した後、表示されるファイル/フォルダーが更新されない問題を修正しました。

  • 既定値の設定が優先されないことがある問題を修正しました。

  • Designer の異なるインストール/構成に対する権限の問題を回避し、スケジュールされたワークフロー機能をサポートするために、本番環境のログを無効にしました。

v1.0.1
  • パッケージが正常にインストールされない問題を解決しました。
v1.0.0
  • Azure Data Lake ファイル入力と Azure Data Lake ファイル出力の初期リリースです

 

接続に使用する Alteryx ツール

Link
Gray icon with file folder

Microsoft Azure Data Lake ファイル入力ツール

Link
Gray icon with file graphic inside

Micorosoft Azure Data Lake ファイル出力ツール

Azure Data Lake ツールを使用すると、Azure Data Lake Store リソースに接続し、データの読み取り / 書き込みを行うことができます。
Azure Data Lake (ADL) ファイル入力ツールを使用して、Azure Data Lake Store (ADLS) にあるファイルから Alteryx ワークフローにデータを読み取ります。
Alteryx ワークフローから ADL にあるファイルにデータを書き込むには、ADL ファイル出力ツールを使用します。 
サポートされているファイル形式は、CSV 、XLSX 、JSON 、Avro です (付加アクションは CSV 形式でのみサポートされます)。
共有キーを除くすべてのツールは、Azure Active Directory エンドポイントに対して認証を行います。

認証と許可

Gen1 および Gen2 ストレージの Azure Data Lake エンドポイントは、認証中に接続するストレージの種類を指定する必要があります。使用しているストレージの種類がわからない場合は、Azure 管理者に問い合わせるか Microsoft Azure Portal で確認してください。

ヒント

  • ワークフローをサーバーまたは AAH に発行するには、サービス間認証または共有キー認証タイプを使用します。そのため、トークンの更新が期限切れになった後でワークフローを再アップロードする必要はありません。
  • メタデータのロードには時間がかかる場合があるため、詳細ユーザー設定 (オプション > ユーザー設定 > 編集ユーザー設定 > 詳細) で [自動設定の無効化] を選択すると、メタデータのロードを無効にできます。

Azure Data Lake Store アカウント内のデータの読み取りと書き込みの権限を付与しておく必要があります。これらのアクセス許可の割り当ておよび適用方法の詳細については、Microsoft の公式ドキュメントを参照してください。

シングルテナンシーとマルチテナンシー

シングルテナントアプリケーションは、登録したテナント (ホームテナントとも呼ばれます) でのみ使用できます。お客様または Azure 管理者は、Designer での認証時に使用するアカウントで、シングルテナント Azure アプリケーションとストレージを作成できます。マルチテナントアプリケーションは、ホームテナントと他のテナントの両方のユーザーが使用できます。

エンドユーザー (基本)

基本的なエンドユーザー認証は、Designer で ADL データにアクセスする最も便利な方法です。組織の Azure テナントでパブリック Alteryx アプリケーションを許可するには、Azure 管理者の支援が必要です。手順を説明する Microsoft のドキュメントを参照してください。 

Tenant: common
ADLS Client ID for the Gen1 Alteryx application: 7fa1a397-27aa-40ad-b47c-a47fa9e600bd
ADLS Client ID for the Gen2 Alteryx application: 2584cace-63ff-47cb-96d2-d153704f4d75


このセットアップ後、ユーザーとその同僚は、通常の Microsoft 資格情報を使用して ADL データにアクセスできます。

エンドユーザー (上級)

高度なエンドユーザー認証は、シングルテナント認証とマルチテナント認証をサポートし、パブリックアプリケーションとプライベートアプリケーションの両方で使用できます。
資格情報の設定についてはMicrosoft のドキュメントで手順を参照してください。

認証の設定

  • テナント ID: テナント ID は Azure ポータルから取得できます。または、テナント ID フィールドに「common」と入力して Azure の自動検出メカニズムを利用できます。複数のテナントにアクセスする場合は、テナント ID を指定できます。マルチテナンシーの詳細については、「シングルテナンシーとマルチテナンシー」セクションを参照してください。
  • クライアント ID: Azure アプリケーションの一意の ID です。クライアント ID フィールドは必須です。 
  • クライアントシークレット: アプリケーションがプライベートの場合は、クライアントシークレットを指定する必要があります。パブリックアプリケーションを使用している場合は、フィールドは空白のままにします。

サービス間

サービス間認証は、サーバーおよびハブでワークフローを発行するのに適しています。
資格情報の設定についてはMicrosoft のドキュメントで手順を参照してください。

共有キー

  • 共有キー認証は、Gen2 ストレージでのみ使用できます。
  • サーバーへの公開は、Designer および Server 2020.4 以降のバージョンでのみ機能します。これは、この認証方式が 2020.4 リリース以降で導入されたためです。

Azure ストレージアカウントを使用すると、マイクロソフトは 2 つのアクセスキーを生成します。これらのアクセスキーを使用して、共有キーの承認を介した Azure Data Lake へのアクセスを承認できます。共有キーとその使用方法の詳細については、Microsoft のドキュメントを参照してください。 

Azure National Clouds とカスタムエンドポイント

v2.0 リリース以降、 ADL コネクタはカスタムエンドポイントへのアクセスをサポートしています。米国および中国の国のクラウドの URL は、認証局エンドポイントフィールドのコネクタの認証画面で選択できます。

アプリケーションのセットアップ

ファイルストレージには、登録されたアプリケーションを使用してアクセスします。アプリケーション登録は、エンドユーザー (基本) と共有キーを除くすべての認証タイプに必要です。Azure Portal にアプリケーションを登録するにはMicrosoft のドキュメントポータルにある手順を参照してください。

Alteryx Designer で Microsoft Azure アプリケーションを使用する

  1. Designer キャンバスに Azure Data Lake 入力または Azure Data Lake 出力を追加します。
  2. ツールを選択すると、右側に設定パネルが表示されます。
  3. 認証データに http://portal.azure.com/ で入手可能なデータを入力します。Azure Portal の操作方法については、Microsoft のドキュメントを参照してください。
  4. ディレクトリ ID (テナント)アプリケーション ID (クライアント) を Designer にコピーする
  5. (オプション) Azure Data Lake Gen1 ストレージに接続する場合は、[Gen1 の使用] を選択します。
  6. サービス間モードで接続する場合は、[クライアントシークレット] を貼り付けます。
  7. 接続 を選択します。

データの選択と構成のオプション

[データ] タブでは、使用するデータを指定できます。

  1. ストレージアカウント名を指定します。このストレージは、認証ページで選択したものと同じタイプ (Gen1、Gen2) である必要があります。 
  2. Gen2 ストレージの場合は、ファイルシステム名を指定します。
  3. Gen2 のストレージとファイルシステムを選択したら、読み書きするファイルのパスを設定できます。パスは、[ファイルパス] フィールドに直接入力するか、ファイルブラウザーを使用して指定できます。Azure Data Lake ファイル出力ツールでは、同じメカニズムを使用して新しいファイルを作成できます。 
  4. Excel ファイルの場合、シート名はファイルブラウザーの下にある [シート] フィールドで指定できます。空の場合、最初のシートが自動で選択されます。新しいファイルの場合、シートにはデフォルト名「Sheet」が付けられます。

ファイル形式と設定

ADL ツールは、 .csv、 .Avro、 .json、 .xlsx のデータ形式をサポートしています。

  • CSV ファイル
    • 読み込み
    • 書き込み: 既存の CSV ファイルを上書きまたは追加できます。 

ヒント

入力および出力データツールとの互換性を保つために、エンコーディングは UTF-8 SIG にする必要があります。

  • JSON ファイル
    • 読み取り: JSON ファイルを正しく読み取るには、BOM なしの UTF-8 エンコーディングを使用する必要があります。 
    • 書き込み: JSON ファイルへの書き込み時のデータ型変換には、Decimal、DateTime 、Time セルが文字列として出力されるという制限があります。
  • Avro ファイル
    • 読み込み
    • 書き込み
  • Excel ファイル
    • 読み取り: すべてのデータは V_Wstrings として読み取られます。 
    • 書き込み

追加の詳細

  • 別のアカウントで作成された特定のフォルダーへのアクセス権 (読み取り / 書き込み) がない状態の場合、これはアクセス権が原因です。
  • トークンが取り消された可能性があることを示すエラーが発生した場合は、ログアウトしてから設定パネルに戻って再認証を行う必要があります。

トークンの有効期間のプロパティは、システム管理者が設定できます。

Azure Data Lake Explorer は、Azure Data Lake Store アカウント内のデータの読み取りと書き込みの権限を付与する必要があります。これらのアクセス許可の割り当ておよび適用方法の詳細については、Microsoft の公式ドキュメントを参照してください。

制限

JSON および Avro: UTF-8 のみ

JSON と Avro は UTF-8 のみです。
 

JSON: サイレント変換エラー

JSON の場合、データ型に大きすぎる数値を格納しようとすると、サイレント変換エラーが発生します。

Excel ファイルへの書き込みは制限あり

Excel ファイルへの書き込みは、現在、完全なファイル上書きのみに制限されています。

Avro Byte フィールドタイプ

バイトタイプのフィールドを持つ Avro ファイルはサポートされていないため、インポート時に失敗します。

出力 : Alteryx 浮動小数点フィールドから Avro 型に変換

Alteryx ワークフローの float フィールド値は、宛先 Avro ファイルでは double に変換されます。

異なる Azure Active Directory ユーザーアカウントを持つ複数のコネクタ

Microsoft Azure Data Lake、 OneDrive、Dynamics CRM コネクタは、メールやパスワードなどの Microsoft ユーザー資格情報による認証をサポートしています。対話型ワークフローでは、現在、これらのコネクタ間で異なる Microsoft ユーザーアカウントで認証を行うことはできません。この制限は、スケジュールされたワークフローには影響しません。これらのコネクタのいずれかで Microsoft ユーザーアカウントで認証され、別の Microsoft ユーザーアカウントで別のコネクタへの認証を試みると、エラーメッセージがポップアップ表示されます。この問題を解決するには、次の推奨事項のいずれかに従います。

  • Azure Active Directory 管理者は、必要な権限を 1 つのユーザーアカウントに付与し、ワークフローを構築するユーザーが、そのワークフローで必要なサービスにアクセスできる 1 つのユーザーアカウントを持つようにすることができます。
  • 別の Microsoft ユーザーアカウントに認証されているコネクタからログアウトしてから、ログインします。
  • 可能な場合は、エンドユーザー認証を使用しないでください。Azure Data Lake コネクタではサービス間認証を、Dynamics CRM コネクタではアプリケーションログイン認証を使用します。
Desktop Automation (Scheduler) not Supported

Desktop Automation (Scheduler) is not supported by this connector.

このページは役に立ちましたか?

Alteryx 製品のご利用中に何か問題がございましたら、Alteryx コミュニティにアクセスするか、サポートにお問い合わせください。このフォームを送信できない場合E メールでお送りください。