Microsoft Azure Data Lake Store
Driver Details | Selon la méthode de connexion choisie, un administrateur peut avoir besoin de configurer l'accès au Azure Data Lake et à Azure Active Directory avant de pouvoir établir une connexion à l'aide des outils du Alteryx Azure Data Lake. |
Type of Support | Lecture et écriture |
Version | Description |
v2.2.0 |
|
v2.1.0 |
|
v2.0 |
|
v1.1.0 |
|
v1.0.2 |
|
v1.0.1 |
|
v1.0.0 |
|
Outils Alteryx utilisés pour la connexion
Les outils Azure Data Lake vous permettent de vous connecter à une ressource Azure Data Lake Store et de lire/écrire des données.
Utilisez l'outil Entrée de fichiers Azure Data Lake (ADL) pour lire des données depuis un fichier situé dans un Azure Data Lake Store (ADLS) vers votre workflow Alteryx.
Utilisez l'outil de sortie de fichiers ADL pour écrire des données de votre workflow Alteryx dans un fichier situé dans un ADLS.
Les formats de fichier pris en charge sont CSV, XLSX, JSON ou Avro (pour l'outil Sortie, l'actionAjouter est prise en charge uniquement pour le format CSV).
Tous ces outils, à l'exception de la clé partagée, s'authentifient par rapport à un point de terminaison Azure Active Directory.
Authentification et autorisation
Les points de terminaison Azure Data Lake pour les stockages Gen1 et Gen2 diffèrent. Lors de l'authentification, vous devez spécifier le type de stockage auquel vous souhaitez vous connecter. Si vous n'êtes pas certain du type de stockage que vous utilisez, vous pouvez demander à votre administrateur Azure ou consulter votre portail Microsoft Azure.
CONSEILS
- Pour la publication de workflows sur Server ou AAH, utilisez les types d'authentification Service-à-Service ou clé partagée. Vous n'aurez pas besoin de télécharger à nouveau votre workflow une fois que votre jeton d'actualisation aura expiré.
- Comme le chargement des métadonnées peut prendre beaucoup de temps, vous pouvez désactiver le chargement des métadonnées en sélectionnant « Désactiver la configuration automatique » dans les paramètres utilisateur avancés (Options > Paramètres utilisateur > Modifier les paramètres utilisateur > Avancés).
Vous devez avoir accordé des autorisations pour lire et écrire des données dans un compte Azure Data Lake Store. Pour plus d'informations sur l'attribution et l'application de ces autorisations, reportez-vous à la documentation officielle de Microsoft.
Locataire unique vs multi-locataire
Les applications mono-propriétaires sont uniquement disponibles à l'utilisateur pour lequel elles ont été enregistrées (utilisateur principal). Votre administrateur Azure et vous-même pourrez créer des applications et un stockage Azure pour un utilisateur unique sous le compte avec lequel vous vous authentifiez dans Designer. Les applications multi-propriétaires sont disponibles aux utilisateurs du compte d'authentification ainsi qu'à d'autres utilisateurs.
Utilisateur final (de base)
L'authentification de l'utilisateur final de base est le moyen le plus pratique d'accéder à vos données ADLS dans Designer. Contactez votre administrateur Azure pour autoriser les applications Alteryx publiques dans le locataire Azure de votre organisation. Consultez la documentation Microsoft qui contient les étapes à suivre.
Tenant: common
ADLS Client ID for the Gen1 Alteryx application: 7fa1a397-27aa-40ad-b47c-a47fa9e600bd
ADLS Client ID for the Gen2 Alteryx application: 2584cace-63ff-47cb-96d2-d153704f4d75
Après cette configuration, vous et vos collègues pouvez utiliser vos informations d'identification Microsoft normales pour accéder aux données ADLS.
Utilisateur final (avancé)
L'authentification l'utilisateur final avancé prend en charge l'authentification unique et multi-locataire et peut être utilisée avec des applications publiques et privées.
Pour la configuration des informations d'identification, reportez-vous aux instructions de la documentation Microsoft.
Configuration de l'authentification
- ID de locataire : vous pouvez obtenir l'ID de locataire à partir de votre portail Azure, ou vous fier au mécanisme de découverte automatique dans Azure en entrant « common » dans le champ ID de locataire. En cas d'accès à plusieurs locataires, vous pouvez spécifier l'ID de locataire. Pour plus d'informations sur les configurations multi-locataires, reportez-vous à la rubrique Locataire unique vs multi-locataire.
- ID client : unique identifiant d'une application Azure. Le champ ID client est obligatoire.
- Secret du client : si votre application est privée, il est obligatoire de fournir un secret du client. Si vous utilisez une application publique, veuillez laisser le champ vide.
Service-à-Service
L'authentification de service à service est adaptée à la publication de workflows sur Server et Hub.
Pour la configuration des informations d'identification, reportez-vous aux instructions de la documentation Microsoft.
Clé partagée
- L'authentification par clé partagée ne peut être utilisée qu'avec les stockages Gen2.
- La publication sur Server ne fonctionne que pour Designer et Server 2020.4 et les versions ultérieures car cette méthode d'authentification a été introduite à partir des versions 2020.4.
Avec un compte de stockage Azure, Microsoft génère deux clés d'accès qui peuvent être utilisées pour autoriser l'accès à Azure Data Lake via une autorisation de clé partagée. Vous trouverez plus d'informations sur la clé partagée et son utilisation dans la documentation Microsoft.
Clouds nationaux Azure et points de terminaison personnalisés
À partir de la version v2.0, les connecteurs ADLS prennent en charge l'accès aux points de terminaison personnalisés. Les URL des clouds nationaux des États-Unis et de la Chine peuvent être sélectionnées sur l'écran d'authentification des connecteurs dans le champ Point de terminaison de l'autorité d'authentification.
Configuration de l'application
Les stockages de fichiers sont accessibles via les applications enregistrées. L'enregistrement de l'application est nécessaire pour tous les types d'authentification, à 'exception de l'Utilisateur final (de base) et de la Clé partagée. Pour enregistrer l'application sur le portail Azure, consultez les instructions sur le portail de documentation Microsoft.
Utiliser les applications Microsoft Azure dans Alteryx Designer
- Ajoutez Entrée Azure Data Lake ou Sortie Azure Data Lake sur le canevas Designer.
- Sélectionnez l'outil pour afficher le panneau Configuration sur la droite.
- Remplissez les données d'authentification avec celles disponibles sur http://portal.azure.com/. Pour naviguer sur le portail Azure, reportez-vous à la documentation Microsoft.
- Copiez l'ID de répertoire (locataire) et l'ID d'application (client) sur Designer
- (Facultatif) Sélectionnez Utiliser Gen1 si vous souhaitez vous connecter au stockage Azure Data Lake Gen1.
- Collez le Secret du client si vous vous connectez en mode Service-à-Service.
- Sélectionnez Se connecter.
Options de sélection des données et de configuration
Dans l'onglet Données, vous pouvez spécifier les données que vous souhaitez utiliser :
- Spécifiez le Nom du compte de stockage. Ce stockage doit être du même type (Gen1, respectivement Gen2) que celui sélectionné sur la page Authentification.
- Pour les stockages Gen2, spécifiez le Nom du système de fichiers.
- Une fois le système de stockage et de fichiers Gen2 sélectionné, vous pouvez configurer le chemin du fichier que vous souhaitez lire ou écrire. Vous pouvez spécifier le chemin d'accès en l'entrant directement dans le champ Chemin du fichier ou en utilisant l'explorateur de fichiers. Pour l'outil Sortie de fichier Azure Data Lake, vous pouvez utiliser le même mécanisme pour créer un nouveau fichier.
- Pour les fichiers Excel, le nom de la feuille peut être indiqué dans le champ Feuille situé sous l'explorateur de fichiers. S'il n'est pas renseigné, la première feuille sera automatiquement sélectionnée. Dans le cas de nouveaux fichiers, le nom par défaut « Feuille » sera attribué à la feuille.
Formats de fichier et configuration
Les outils ADLS prennent en charge les formats de données suivants : .csv, .avro, .json et .xlsx.
- Fichiers CSV
- Lecture
- Écrire : vous pouvez remplacer ou ajouter un fichier CSV existant.
Conseil
Pour assurer la compatibilité avec les outils d'entrée et de sortie de données, le codage doit être UTF-8 SIG.
- Fichiers JSON
- Lire : pour lire correctement les fichiers JSON, le codage UTF-8 sans indicateur d'ordre des octets (BOM) doit être utilisé.
- Écrire : la conversion du type de données lors de l'écriture dans des fichiers JSON présente les limitations suivantes : les cellules Décimales, DateHeure et Heure sont sorties sous forme de chaînes.
- Fichiers Avro
- Lecture
- Écriture
- Fichiers Excel
- Lecture : toutes les données sont lues en tant que V_Wstrings.
- Écriture
Détails supplémentaires
- Si l'état est sans accès (lecture/écriture) à un certain dossier créé par un autre compte, cela est dû à des autorisations.
- Si vous rencontrez une erreur indiquant que le jeton a peut-être été révoqué, vous devez vous déconnecter, puis vous reconnecter au panneau de configuration pour vous authentifier à nouveau.
Les propriétés de durée de vie des jetons sont configurables par l'administrateur système.
Azure Data Lake Explorer doit autoriser la lecture et l'écriture de données dans un compte Azure Data Lake Store. Pour plus d'informations sur l'attribution et l'application de ces autorisations, reportez-vous à la documentation officielle de Microsoft.
Limitations
JSON et Avro sont UTF-8 uniquement.
Pour JSON, il existe une erreur de conversion silencieuse si vous essayez de stocker des numéros trop grands pour leur type de données.
L'écriture dans des fichiers Excel est actuellement limitée à un seul remplacement de fichier complet.
Les fichiers Avro avec des champs de type octets ne sont pas pris en charge et échoueront lors de l'importation.
Les valeurs des champs flottants de workflows Alteryx sont converties en doubles dans le fichier Avro de destination.
Les connecteurs Microsoft Azure Data Lake, OneDrive et Dynamics CRM prennent en charge l'authentification via les informations d'identification utilisateur Microsoft, telles que l'adresse e-mail et le mot de passe. Dans les workflows interactifs, il n'est actuellement pas possible de s'authentifier auprès de différents comptes utilisateur Microsoft sur ces connecteurs. Cette limitation n'a pas d'incidence sur les workflows planifiés. Si vous êtes authentifié avec un compte utilisateur Microsoft dans l'un de ces connecteurs et essayez de vous authentifier auprès d'un autre connecteur avec un compte utilisateur Microsoft différent, un message d'erreur s'affiche. Pour résoudre ce problème, suivez l'une des recommandations suivantes :
- L'administrateur Azure Active Directory peut accorder les autorisations nécessaires à un compte utilisateur et s'assurer que l'utilisateur qui crée le workflow dispose d'un compte utilisateur ayant accès aux services requis dans ce workflow.
- Déconnectez-vous de tous les connecteurs authentifiés sur un autre compte utilisateur Microsoft avant d'essayer de vous connecter.
- Évitez d'utiliser l'authentification de l'utilisateur final lorsque cela est possible. Utilisez l'authentification de service-à-service dans les connecteurs Azure Data Lake et l'authentification par connexion à l'application dans les connecteurs Dynamics CRM.
Desktop Automation (Scheduler) is not supported by this connector.