Skip to main content

Microsoft Azure Data Lake Store

Tipo di connessione

Strumento Alteryx. La versione più recente è disponibile in Alteryx Marketplace .

Dettagli driver

A seconda del metodo di accesso scelto, è possibile che un amministratore debba configurare l'accesso ad Azure Data Lake e Azure Active Directory prima di poter stabilire una connessione utilizzando gli strumenti Alteryx Azure Data Lake.

Tipo di supporto

Lettura e scrittura

Versione

Descrizione

v2.5.0

  • Compatibile con Alteryx Designer e Server 2021.4.2 Patch 6, 2022.1 Patch 4 e versioni successive.

  • Richiede AMP Engine.

  • Alteryx Server richiede credenziali memorizzate in DCM per eseguire i flussi di lavoro.

  • Aggiunta un’opzione per scaricare i file localmente ed elaborarli in un secondo momento.

  • Rimosso il supporto per l'autenticazione Gen1.

  • Risolti i problemi relativi all'autenticazione DCM. (TPM-2462, TPM-2176)

  • Risolti i problemi a causa dei quali l'input ADLS non leggeva correttamente i valori Null. (TPM-3098, TPM-2659, TPM-2229)

  • Risolti i problemi che impedivano l’esecuzione del flusso di lavoro se gli strumenti ADLS erano impostati per avviare l'elaborazione dei dati su una riga diversa da 1. (TPM-2609, TPM-2277)

  • Risolto il problema a causa del quale l'input ADLS ignorava altri dati dopo l'elaborazione di un singolo ciclo di blocchi. (TPM-2781)

  • Risolto il problema a causa del quale l'input ADLS restituiva un errore di file CSV non valido. (TPM-2175)

  • Risolto il problema a causa del quale l'output ADLS modificava i valori della data. (TPM-1928)

v2.4.3

  • Compatibile con Alteryx Designer e Server 2021.4.2 Patch 4, 2022.1 Patch 2 e versioni successive.

  • Compatibile solo con AMP Engine.

  • Aggiunto il supporto per DCM .

    • DCM necessario per l'esecuzione di questo connettore su Alteryx Server.

  • Compatibile con FIPS.

  • La convalida SSL/TLS viene ora eseguita a fronte dell'archivio certificati Windows.

  • Prestazioni di scrittura e stabilità migliorate.

  • Aggiunta l'opzione per regolare il consumo di memoria e le prestazioni modificando le dimensioni del blocco di caricamento variabili.

  • Risolto il problema a causa del quale i dati XLSX venivano troncati quando le celle contenevano più di 255 caratteri.

  • Risolto il problema dei caratteri non Unicode nei certificati SSL.

  • Risolto il problema con lo strumento di output ADLS che aggiungeva caratteri di virgolette doppie nonostante il campo Carattere virgolette fosse impostato su Nessuno . (TPM-1964)

  • Miglioramenti della sicurezza.

v2.2.0

  • Consente all'utente di specificare un delimitatore CSV personalizzato in Output.

  • È stata corretta una potenziale vulnerabilità XXE.

v2.1.0

  • Interfaccia utente nuova e migliorata.

  • Sono stati corretti alcuni problemi minori.

  • Compatibile con Alteryx Designer e Server a partire dalla versione 2021.2.

v2.0

  • È stata aggiornata l'interfaccia utente e migliorata la gestione degli errori

  • È stato aggiunto il supporto per gli archivi Gen2

  • È stato aggiunto il supporto per Azure per enti pubblici, China Cloud ed endpoint personalizzati

  • Supporto per l'autenticazione Chiave condivisa

  • Supporto per le applicazioni pubbliche (proprie e Alteryx)

  • Supporto multi-tenancy

  • Supporto per l'input e l'output di Excel

  • È stata aggiunta la possibilità di utilizzare delimitatori personalizzati per la lettura e la scrittura di file .csv

  • Compatibile con Alteryx Designer e Server a partire dalla versione 2019.3.

v1.1.0

  • Sono stati corretti alcuni errori di autenticazione Utente finale

  • Possibilità per gli utenti di specificare l'URI di reindirizzamento per l'autenticazione Utente finale

v1.0.2

  • Aggiornamento delle opzioni di Tabella codici.

  • Distinzione tra codifiche con la stessa lingua (ad esempio 'Lingua' -> 'Lingua (codice specifico)') e codifiche in ordine alfabetico.

  • Possibilità per l'utente di specificare la codifica per i file CSV nello strumento di output.

  • È stato migliorato il messaggio di errore quando è stato specificato un nome di archivio non valido.

  • Gestione migliorata della conversione dei dati in modo da non generare un avviso al posto di un errore quando in un campo manca un valore.

  • È stato corretto l'errore per cui la visualizzazione di file/cartelle non veniva aggiornata dopo la modifica del nome dell'archivio da parte dell'utente.

  • È stato risolto il problema a causa del quale occasionalmente le impostazioni predefinite venivano ignorate.

  • È stata disattivata la registrazione in produzione per evitare problemi di autorizzazioni per installazioni/configurazioni diverse di Designer e supportare la funzionalità del flusso di lavoro pianificato

v1.0.1

  • È stato risolto il problema che impediva l'installazione dei pacchetti

v1.0.0

  • Versione iniziale di Input del file Azure Data Lake e Output del file Azure Data Lake

Strumenti Alteryx utilizzati per Connect

Data Connection Manager

Gli strumenti di Azure Data Lake Store versione 2.3.0 e successive supportano Data Connection Manager per un'archiviazione più semplice e sicura delle tue credenziali. Crea una connessione ad Azure Data Lake Store e riutilizza con facilità le credenziali memorizzate nei flussi di lavoro che includono gli strumenti Azure Data Lake Store. Alteryx Server richiede credenziali memorizzate per eseguire correttamente i flussi di lavoro pubblicati.

Abilitazione di AMP Engine

Assicurati che AMP Engine sia abilitato per i flussi di lavoro che contengono gli strumenti Azure Data Lake Store versione 2.3.0 e successive.

Autenticazione e autorizzazione

Gli endpoint Azure Data Lake per gli archivi Gen1 e Gen2 sono diversi, per cui durante l'autenticazione devi specificare a quale tipo di archivio desideri connetterti. In caso di dubbi sul tipo di archiviazione utilizzato, puoi rivolgerti all'amministratore di Azure o controllare sul portale di Microsoft Azure .

SUGGERIMENTI

  • Per pubblicare i flussi di lavoro su Server o AAH, utilizza il metodo di autenticazione Da servizio a servizio o Chiave condivisa, in modo da non dover ricaricare il flusso di lavoro una volta scaduto il token di aggiornamento.

  • Poiché il caricamento dei metadati può richiedere molto tempo, puoi disabilitare il caricamento dei metadati selezionando "Disabilita configurazione automatica" nelle impostazioni utente avanzate (Opzioni > Impostazioni utente > Modifica impostazioni utente > Avanzate).

È necessario disporre delle autorizzazioni di lettura e scrittura dei dati all'interno di un account Azure Data Lake Store. Per ulteriori informazioni sull'assegnazione e l'applicazione di queste autorizzazioni, consulta la documentazione ufficiale Microsoft.

Single-tenancy e multi-tenancy

Le applicazioni single-tenant sono disponibili solo nel tenant in cui sono state registrate, noto anche come tenant principale. Tu o l'amministratore Azure potete creare applicazioni e storage Azure single-tenant sotto il vostro account che utilizzerete durante l'autenticazione in Designer. Le applicazioni multi-tenant sono disponibili per gli utenti sia nel proprio tenant principale che in altri tenant.

Utente finale (base)

L'autenticazione Utente finale di base costituisce il metodo più pratico per accedere ai dati ADLS in Designer. Contatta l'amministratore di Azure per consentire le applicazioni Alteryx pubbliche nel tenant di Azure dell'organizzazione. Consulta la documentazione Microsoft che ne descrive i passaggi .

Tenant: Common

ADLS Client ID for the Gen2 Alteryx application: 2584cace-63ff-47cb-96d2-d153704f4d75

Dopo questa configurazione, tu e i tuoi colleghi potete utilizzare le normali credenziali Microsoft per accedere ai dati ADLS.

Utente finale (avanzate)

L'autenticazione avanzata Utente finale supporta l'autenticazione single-tenant e multi-tenant e può essere utilizzata con applicazioni sia pubbliche che private.

Per la configurazione delle credenziali, consulta le istruzioni nella documentazione Microsoft .

Configurazione dell'autenticazione

  • ID tenant: puoi ottenere l'ID tenant dal portale di Azure o affidarti al meccanismo di rilevamento automatico in Azure digitando "common" nel campo ID tenant. In caso di accesso a più tenant, puoi specificare l'ID tenant. Per ulteriori informazioni sul multi-tenancy, consulta la sezione Single-tenancy e multi-tenancy.

  • ID client: identificatore univoco di un'applicazione Azure. Il campo ID client è obbligatorio.

  • Segreto client: se la tua applicazione è privata, è necessario fornire un segreto client. Se utilizzi un'applicazione pubblica, lascia vuoto il campo.

Da servizio a servizio

L'autenticazione Da servizio a servizio è adatta per la pubblicazione di flussi di lavoro su Server e Hub.

Per la configurazione delle credenziali, consulta le istruzioni nella documentazione Microsoft .

Chiave condivisa

Nota

  • L'autenticazione Chiave condivisa può essere utilizzata solo con gli archivi Gen2.

  • La pubblicazione sul Server funzionerà solo per Designer e Server 2020.4 e versioni successive, in quanto questo metodo di autenticazione è stato introdotto a partire dalle versioni 2020.4.

Con un account di archiviazione di Azure, Microsoft genera due chiavi di accesso che possono essere utilizzate per autorizzare l'accesso ad Azure Data Lake tramite l'autenticazione Chiave condivisa. Ulteriori informazioni sulla chiave condivisa e sul suo utilizzo sono disponibili nella documentazione Microsoft .

Cloud nazionali Azure ed endpoint personalizzati

A partire dalla versione v2.0, i connettori ADLS supportano l'accesso agli endpoint personalizzati. Gli URL per i cloud nazionali degli Stati Uniti e della Cina possono essere selezionati nella schermata di autenticazione dei connettori nel campo Endpoint dell'autorità di certificazione.

Configurazione dell'applicazione API Microsoft Azure personalizzata

Per impostare un'applicazione API personalizzata per questo strumento, consulta la nostra guida.Configurazione dell'applicazione API Microsoft Azure

Selezione dei dati e opzioni di configurazione

Nella scheda Dati puoi specificare i dati che desideri utilizzare:

  1. Specifica il Nome account di archiviazione . Questo archivio deve essere dello stesso tipo (Gen1, Gen2) selezionato nella pagina di autenticazione.

  2. Per gli archivi Gen2 specifica il Nome file system .

  3. Una volta selezionati l'archivio e il file system per Gen2, puoi configurare il percorso del file da leggere o scrivere. È possibile specificare il percorso tramite input diretto nel campo Percorso file oppure utilizzando l'utilità di selezione file. Per lo strumento Output del file Azure Data Lake, puoi utilizzare lo stesso meccanismo per creare un nuovo file.

  4. Per i file di Excel, puoi specificare il nome del foglio nel campo Foglio al di sotto dell'utilità di selezione file. Se lo lasci vuoto, verrà selezionato automaticamente il primo foglio. In caso di nuovi file, al foglio verrà assegnato il nome predefinito "Foglio".

Formati e configurazione dei file

Gli strumenti ADLS supportano i seguenti formati di dati: .csv, .avro, .json e .xlsx.

  • File CSV

    • Leggi

    • Scrittura : puoi sovrascrivere un file CSV esistente o aggiungervi dati.

Suggerimento

Per la compatibilità con gli strumenti Dati di input e Dati di output, la codifica deve essere UTF-8 SIG .

  • File JSON

    • Lettura : per leggere correttamente i file JSON, questi devono utilizzare la codifica UTF-8 senza BOM .

    • Scrittura : la conversione del tipo di dati durante la scrittura nei file JSON presenta una limitazione: le celle di tipo Decimal, DateTime e Time vengono restituite come String .

  • File Avro

    • Leggi

    • Scrivi

  • File Excel

    • Lettura: tutti i dati vengono letti come V_Wstrings.

    • Scrivi

Ulteriori dettagli

  • In caso di stato senza accesso (lettura/scrittura) a una determinata cartella creata da un altro account, il problema è dovuto alle autorizzazioni.

  • Se si verifica un errore che indica che il token potrebbe essere stato revocato, è necessario disconnettersi e quindi tornare al pannello di configurazione per eseguire nuovamente l'autenticazione.

Nota

Le proprietà di durata del token possono essere configurate dall'amministratore di sistema.

In Azure Data Lake Explorer è necessario che siano state concesse autorizzazioni di lettura e scrittura dei dati all'interno di un account Azure Data Lake Store. Per ulteriori informazioni sull'assegnazione e l'applicazione di queste autorizzazioni, consulta la documentazione ufficiale Microsoft.

Limitazioni

A partire dagli strumenti Azure Data Lake Store versione 2.5.0, l'autenticazione Gen1 non è supportata.

JSON e Avro sono solo UTF-8.

Per JSON, si verifica un errore di conversione invisibile all'utente se tenti di memorizzare numeri troppo grandi per il tipo di dati.

La scrittura nei file Excel è attualmente limitata alla sola sovrascrittura completa del file.

I file Avro con campi di tipo byte non sono supportati e avranno esito negativo al momento dell'importazione.

I valori dei campi di tipo float del flusso di lavoro Alteryx vengono convertiti in tipo double nel file Avro di destinazione.

I connettori Microsoft Azure Data Lake, OneDrive e Dynamics CRM supportano l'autenticazione tramite le credenziali utente Microsoft, come e-mail e password. Nei flussi di lavoro interattivi, non è attualmente possibile eseguire l'autenticazione con account utente Microsoft diversi in questi connettori. Questa limitazione non influisce sui flussi di lavoro pianificati. Nel caso in cui l'autenticazione sia stata eseguita con un account utente Microsoft in uno di questi connettori e tenti di eseguire l'autenticazione in un altro connettore con un account utente Microsoft diverso, verrà visualizzato un messaggio di errore popup. Per risolvere il problema, attieniti a uno dei seguenti consigli:

  • L'amministratore di Azure Active Directory può concedere le autorizzazioni necessarie a un account utente e accertarsi che l'utente che crea il flusso di lavoro disponga di un account utente con accesso ai servizi necessari in tale flusso di lavoro.

  • Disconnettiti da tutti i connettori autenticati con un account utente Microsoft diverso prima di tentare l'accesso.

  • Evita di utilizzare l'autenticazione Utente finale quando possibile. Utilizza l'autenticazione Da servizio a servizio nei connettori Azure Data Lake e l'autenticazione di accesso all'applicazione nei connettori Dynamics CRM.

Desktop Automation (programmatore) non è supportato da questo connettore.