Microsoft Azure Data Lake Store

Versione:
2023.1
Last modified: August 26, 2022
Driver Details

A seconda del metodo di accesso scelto, è possibile che un amministratore debba configurare l'accesso ad Azure Data Lake e Azure Active Directory prima di poter stabilire una connessione utilizzando gli strumenti Alteryx Azure Data Lake.

Type of Support

Lettura & Scrittura

Note del release
Versione Descrizione
v2.2.0
  • Consente all'utente di specificare un delimitatore CSV personalizzato in Output.

  • È stata corretta una potenziale vulnerabilità XXE.
v2.1.0
  • Interfaccia utente nuova e migliorata.
  • Sono stati corretti alcuni problemi minori.
  • Compatibile con Alteryx Designer a partire dalla versione 2021.2.
v2.0
  • È stata aggiornata l'interfaccia utente e migliorata la gestione degli errori
  • È stato aggiunto il supporto per gli archivi Gen2
  • È stato aggiunto il supporto per Azure per enti pubblici, China Cloud ed endpoint personalizzati
  • Supporto per l'autenticazione Chiave condivisa
  • Supporto per le applicazioni pubbliche (proprie e Alteryx)
  • Supporto multi-tenancy
  • Supporto per l'input e l'output di Excel
  • È stata aggiunta la possibilità di utilizzare delimitatori personalizzati per la lettura e la scrittura di file .csv
  • Compatibile con Alteryx Designer a partire dalla versione 2019.3.
v1.1.0
  • Sono stati corretti alcuni errori di autenticazione Utente finale
  • Possibilità per gli utenti di specificare l'URI di reindirizzamento per l'autenticazione Utente finale
v1.0.2
  • Aggiornamento delle opzioni di Tabella codici.

  • Distinzione tra codifiche con la stessa lingua (ad esempio 'Lingua' -> 'Lingua (codice specifico)') e codifiche in ordine alfabetico.

  • Possibilità per l'utente di specificare la codifica per i file CSV nello strumento di output.

  • È stato migliorato il messaggio di errore quando è stato specificato un nome di archivio non valido.

  • Gestione migliorata della conversione dei dati in modo da non generare un avviso al posto di un errore quando in un campo manca un valore.

  • È stato corretto l'errore per cui la visualizzazione di file/cartelle non veniva aggiornata dopo la modifica del nome dell'archivio da parte dell'utente.

  • È stato risolto il problema a causa del quale occasionalmente le impostazioni predefinite venivano ignorate.

  • È stata disattivata la registrazione in produzione per evitare problemi di autorizzazioni per installazioni/configurazioni diverse di Designer e supportare la funzionalità del flusso di lavoro pianificato.

v1.0.1
  • È stato risolto il problema che impediva l'installazione dei pacchetti
v1.0.0
  • Versione iniziale di Input del file Azure Data Lake e Output del file Azure Data Lake

 

Strumenti Alteryx utilizzati per Connect

Link
Gray icon with file folder

Strumento Input del file Microsoft Azure Data Lake

Link
Gray icon with file graphic inside

Strumento Output del file Microsoft Azure Data Lake

Gli strumenti Azure Data Lake consentono di connetterti a una risorsa Azure Data Lake Store ed eseguire la lettura/scrittura dei dati.
Utilizza lo strumento Input del file Azure Data Lake (ADL) per leggere i dati dai file contenuti in un Azure Data Lake Store (ADLS) nel flusso di lavoro Alteryx.
Per scrivere dati dal flusso di lavoro Alteryx in un file contenuto in un ADLS, utilizza lo strumento Output del file ADL
I formati di file supportati sono CSV, XLSX, JSON o Avro (per lo strumento Output, l'azione Aggiungi è supportata solo per il formato CSV).
Tutti questi strumenti, tranne quando si utilizza Chiave condivisa, eseguono l'autenticazione con un endpoint Azure Active Directory.

Autenticazione e autorizzazione

Gli endpoint Azure Data Lake per gli archivi Gen1 e Gen2 sono diversi, per cui durante l'autenticazione devi specificare a quale tipo di archivio desideri connetterti. In caso di dubbi sul tipo di archiviazione utilizzato, puoi rivolgerti all'amministratore di Azure o controllare sul portale di Microsoft Azure.

SUGGERIMENTI

  • Per pubblicare i flussi di lavoro su Server o AAH, utilizza il metodo di autenticazione Da servizio a servizio o Chiave condivisa, in modo da non dover ricaricare il flusso di lavoro una volta scaduto il token di aggiornamento.
  • Poiché il caricamento dei metadati può richiedere molto tempo, puoi disabilitare il caricamento dei metadati selezionando "Disabilita configurazione automatica" nelle impostazioni utente avanzate (Opzioni > Impostazioni utente > Modifica impostazioni utente > Avanzate).

È necessario disporre delle autorizzazioni di lettura e scrittura dei dati all'interno di un account Azure Data Lake Store. Per ulteriori informazioni sull'assegnazione e l'applicazione di queste autorizzazioni, consulta la documentazione ufficiale Microsoft.

Single-tenancy e multi-tenancy

Le applicazioni single-tenant sono disponibili solo nel tenant in cui sono state registrate, noto anche come tenant principale. Tu o l'amministratore Azure potete creare applicazioni e storage Azure single-tenant sotto il vostro account che utilizzerete durante l'autenticazione in Designer. Le applicazioni multi-tenant sono disponibili per gli utenti sia nel proprio tenant principale che in altri tenant.

Utente finale (base)

L'autenticazione Utente finale di base costituisce il metodo più pratico per accedere ai dati ADLS in Designer. Contatta l'amministratore di Azure per consentire le applicazioni Alteryx pubbliche nel tenant di Azure dell'organizzazione. Consulta la documentazione Microsoft che ne descrive i passaggi

Tenant: common
ADLS Client ID for the Gen1 Alteryx application: 7fa1a397-27aa-40ad-b47c-a47fa9e600bd
ADLS Client ID for the Gen2 Alteryx application: 2584cace-63ff-47cb-96d2-d153704f4d75


Dopo questa configurazione, tu e i tuoi colleghi potete utilizzare le normali credenziali Microsoft per accedere ai dati ADLS.

Utente finale (avanzate)

L'autenticazione Utente finale (avanzate) supporta l'autenticazione single-tenant e multi-tenant e può essere utilizzata con applicazioni sia pubbliche che private.
Per la configurazione delle credenziali, consulta le istruzioni nella documentazione Microsoft.

Configurazione dell'autenticazione

  • ID tenant: puoi ottenere l'ID tenant dal portale di Azure o affidarti al meccanismo di rilevamento automatico in Azure digitando "common" nel campo ID tenant. In caso di accesso a più tenant, puoi specificare l'ID tenant. Per ulteriori informazioni sul multi-tenancy, consulta la sezione Single-tenancy e multi-tenancy.
  • ID client: l'identificatore univoco di un'applicazione Azure. Il campo ID client è obbligatorio. 
  • Segreto client: se la tua applicazione è privata, è necessario fornire un segreto client. Se utilizzi un'applicazione pubblica, lascia vuoto il campo.

Da servizio a servizio

L'autenticazione Da servizio a servizio è adatta per la pubblicazione di flussi di lavoro su Server e Hub.
Per la configurazione delle credenziali, consulta le istruzioni nella documentazione Microsoft.

Chiave condivisa

  • L'autenticazione Chiave condivisa può essere utilizzata solo con gli archivi Gen2.
  • La pubblicazione sul Server funzionerà solo per Designer e Server 2020.4 e versioni successive, in quanto questo metodo di autenticazione è stato introdotto a partire dalle versioni 2020.4.

Con un account di archiviazione di Azure, Microsoft genera due chiavi di accesso che possono essere utilizzate per autorizzare l'accesso ad Azure Data Lake tramite l'autenticazione Chiave condivisa. Ulteriori informazioni sulla chiave condivisa e sul suo utilizzo sono disponibili nella documentazione Microsoft

Cloud nazionali Azure ed endpoint personalizzati

A partire dalla versione v2.0, i connettori ADLS supportano l'accesso agli endpoint personalizzati. Gli URL per i cloud nazionali degli Stati Uniti e della Cina possono essere selezionati nella schermata di autenticazione dei connettori nel campo Endpoint dell'autorità di certificazione.

Configurazione dell'applicazione

Gli archivi file sono accessibili tramite applicazioni registrate. La registrazione dell'applicazione è necessaria per tutti i metodi di autenticazione, ad eccezione dell'autenticazione Utente finale (base) e Chiave condivisa. Per registrare l'applicazione sul portale di Azure, consulta le istruzioni sul portale della documentazione Microsoft.

Utilizza delle applicazioni Microsoft Azure in Alteryx Designer

  1. Aggiungi Input del file Azure Data Lake o Output del file Azure Data Lake sul canvas di Designer.
  2. Seleziona lo strumento per visualizzare il pannello Configurazione sulla destra.
  3. Compila i dati di autenticazione con quelli disponibili su http://portal.azure.com/. Per spostarti nel portale di Azure, consulta la documentazione Microsoft.
  4. Copia l'ID directory (tenant) e l'ID applicazione (client) in Designer
  5. (Opzionale) Seleziona Usa Gen1 se desideri connetterti a un archivio Azure Data Lake Gen1.
  6. Incolla il Segreto client se esegui la connessione in modalità Da servizio a servizio.
  7. Seleziona Connetti.

Selezione dei dati e opzioni di configurazione

Nella scheda Dati puoi specificare i dati che desideri utilizzare:

  1. Specifica il Nome account di archiviazione. Questo archivio deve essere dello stesso tipo (Gen1, Gen2) selezionato nella pagina di autenticazione. 
  2. Per gli archivi Gen2 specifica il Nome file system.
  3. Una volta selezionati l'archivio e il file system per Gen2, puoi configurare il percorso del file da leggere o scrivere. È possibile specificare il percorso tramite input diretto nel campo Percorso file oppure utilizzando l'utilità di selezione file. Per lo strumento Output del file Azure Data Lake, puoi utilizzare lo stesso meccanismo per creare un nuovo file. 
  4. Per i file di Excel, puoi specificare il nome del foglio nel campo Foglio al di sotto dell'utilità di selezione file. Se lo lasci vuoto, verrà selezionato automaticamente il primo foglio. In caso di nuovi file, al foglio verrà assegnato il nome predefinito "Foglio".

Formati e configurazione dei file

Gli strumenti ADLS supportano i seguenti formati di dati: .csv, .avro, .json e .xlsx.

  • File CSV
    • Leggere
    • Scrittura: puoi sovrascrivere un file esistente o aggiungervi dati 

Suggerimento

Per la compatibilità con gli Dati di input e Dati di output, la codifica deve essere UTF-8 SIG.

  • File JSON
    • Lettura: per leggere correttamente i file JSON, devono utilizzare la codifica UTF-8 senza BOM. 
    • Scrittura: la conversione del tipo di dati durante la scrittura nei file JSON presenta una limitazione: le celle di tipo Decimal, DateTime e Time vengono restituite come String.
  • File Avro
    • Leggere
    • Scrivi
  • File Excel
    • Lettura: tutti i dati vengono letti come V_Wstrings. 
    • Scrivi

Ulteriori dettagli

  • In caso di stato senza accesso (lettura/scrittura) a una determinata cartella creata da un altro account, il problema è dovuto alle autorizzazioni.
  • Se si verifica un errore che indica che il token potrebbe essere stato revocato, è necessario disconnettersi e quindi tornare al pannello di configurazione per eseguire nuovamente l'autenticazione.

Le proprietà di durata del token possono essere configurate dall'amministratore di sistema.

In Azure Data Lake Explorer è necessario che siano state concesse autorizzazioni di lettura e scrittura dei dati all'interno di un account Azure Data Lake Store. Per ulteriori informazioni sull'assegnazione e l'applicazione di queste autorizzazioni, consulta la documentazione ufficiale Microsoft.

Limitazioni

JSON e Avro: solo UTF-8

JSON e Avro sono solo UTF-8.
 

JSON: errore di conversione invisibile all'utente

Per JSON, si verifica un errore di conversione invisibile all'utente se tenti di memorizzare numeri troppo grandi per il tipo di dati.

Scrittura nei file Excel limitata

La scrittura nei file Excel è attualmente limitata alla sola sovrascrittura completa del file.

Tipo di campo byte dei file Avro

I file Avro con campi di tipo byte non sono supportati e avranno esito negativo al momento dell'importazione.

Output: conversione dei campi di tipo float di Alteryx in Avro

I valori dei campi di tipo float del flusso di lavoro Alteryx vengono convertiti in tipo double nel file Avro di destinazione.

Più connettori con account utente Azure Active Directory diversi

I connettori Microsoft Azure Data Lake, OneDrive e Dynamics CRM supportano l'autenticazione tramite le credenziali utente Microsoft, come e-mail e password. Nei flussi di lavoro interattivi, non è attualmente possibile eseguire l'autenticazione con account utente Microsoft diversi in questi connettori. Questa limitazione non influisce sui flussi di lavoro pianificati. Nel caso in cui l'autenticazione sia stata eseguita con un account utente Microsoft in uno di questi connettori e tenti di eseguire l'autenticazione in un altro connettore con un account utente Microsoft diverso, verrà visualizzato un messaggio di errore popup. Per risolvere il problema, attieniti a uno dei seguenti consigli:

  • L'amministratore di Azure Active Directory può concedere le autorizzazioni necessarie a un account utente e accertarsi che l'utente che crea il flusso di lavoro disponga di un account utente con accesso ai servizi necessari in tale flusso di lavoro.
  • Disconnettiti da tutti i connettori autenticati con un account utente Microsoft diverso prima di tentare l'accesso.
  • Evita di utilizzare l'autenticazione Utente finale quando possibile. Utilizza l'autenticazione Da servizio a servizio nei connettori Azure Data Lake e l'autenticazione di accesso all'applicazione nei connettori Dynamics CRM.
Desktop Automation (Scheduler) not Supported

Desktop Automation (Scheduler) is not supported by this connector.

Questa pagina è stata utile?

Si sono verificati problemi con il tuo prodotto Alteryx? Visita la community Alteryx o contatta il supporto. Non riesci a inviare questo modulo? Inviaci un'e-mail.