Microsoft Azure Data Lake Store
Tipo de conexión | Herramienta de Alteryx. La versión más reciente está disponible en Alteryx Marketplace . |
Detalles del controlador | Según el método de inicio de sesión elegido, es posible que un administrador deba configurar el acceso a Azure Data Lake y Azure Active Directory antes de que se pueda establecer una conexión con las herramientas de Alteryx Azure Data Lake. |
Tipo de soporte | Leer y escribir |
Versión | Descripción |
v2.5.0 |
|
v2.4.3 |
|
v2.2.0 |
|
v2.1.0 |
|
v2.0 |
|
v1.1.0 |
|
v1.0.2 |
|
v1.0.1 |
|
v1.0.0 |
|
Herramientas de Alteryx utilizadas para establecer conexiones
Administrador de conexiones de datos (DCM)
Las herramientas de Azure Data Lake Store versión 2.3.0 y posteriores admiten el Administrador de conexiones de datos para garantizar un almacenamiento más fácil y seguro de tus credenciales. Crea una conexión a Azure Data Lake Store y reutiliza con facilidad las credenciales almacenadas en flujos de trabajo que incluyen las herramientas de Azure Data Lake Store. Alteryx Server requiere credenciales almacenadas para ejecutar los flujos de trabajo publicados correctamente.
Habilitar AMP Engine
Asegúrate de tener habilitado AMP Engine para los flujos de trabajo que contienen las herramientas de Azure Data Lake Store versión 2.3.0 y posteriores.
Autenticación y autorización
Los puntos de conexión de Azure Data Lake para los almacenamientos Gen1 y Gen2 varían; durante la autenticación, debes especificar a qué tipo de almacenamiento deseas conectarte. En caso de que no estés seguro del tipo de almacenamiento que estás utilizando, puedes preguntarle al administrador de Azure o consultar el portal de Microsoft Azure .
SUGERENCIAS
Para publicar flujos de trabajo en Server o en AAH, utiliza los tipos de autenticación de servicio a servicio o de clave compartida, de modo que no tengas que volver a cargar el flujo de trabajo una vez que caduque el token de actualización.
Ya que la carga de los metadatos puede demorar mucho tiempo, puedes desactivar la carga de los metadatos seleccionando Deshabilitar la configuración automática en Configuración avanzada del usuario (Opciones > Configuración del usuario > Editar configuración del usuario > Avanzadas).
Debes tener permisos para leer y escribir datos en una cuenta de Azure Data Lake Store. Para obtener más información sobre cómo se asignan y aplican estos permisos, consulta la documentación oficial de Microsoft.
Comparación de un solo inquilino con multiinquilinos
Las aplicaciones de un solo inquilino están disponibles únicamente en el inquilino en el que se registraron, también conocido como el inquilino principal. Tú o tu administrador de Azure pueden crear aplicaciones y almacenamiento de Azure de un solo inquilino con tu cuenta que utilizarás durante la autenticación en Alteryx Designer. Las aplicaciones de varios inquilinos están disponibles para los usuarios tanto en su inquilino principal como en los demás inquilinos.
Usuario final (básico)
La autenticación del usuario final básica es la forma más cómoda de acceder a los datos de ADLS en Designer. Comunícate con el administrador de Azure para permitir aplicaciones públicas de Alteryx en el inquilino de Azure de la organización. Consulta la documentación de Microsoft en la que se describen los pasos .
Inquilino:
común
Id. de cliente de ADLS para la aplicación Alteryx Gen2:
2584cace-63ff-47cb-96d2-d153704f4d75
Después de esta configuración, tanto tú como tus colegas podrán utilizar sus credenciales normales de Microsoft para acceder a los datos de ADLS.
Usuario final (avanzado)
La autenticación de usuario final avanzada admite la autenticación de uno y varios inquilinos, y se puede utilizar con aplicaciones públicas y privadas.
Para obtener información sobre la configuración de credenciales, consulta las instrucciones en la documentación de Microsoft .
Configuración de autenticación
Id. de inquilino: Puedes obtener el Id. de inquilino en el portal de Azure o confiar en el mecanismo de detección automática de Azure escribiendo “common” en el campo Id. de inquilino. En caso de acceso a multiinquilinos, puedes especificar el Id. de inquilino. Para obtener más información acerca de los multiinquilinos, consulta la sección Comparación de un solo inquilino con multiinquilinos
Id. de cliente: El identificador único de una aplicación de Azure. El campo Id. de cliente es obligatorio.
Secreto de cliente: Si tu aplicación es privada, es obligatorio proporcionar un secreto del cliente. Si utilizas una aplicación pública, deja el campo vacío.
Servicio a servicio
La autenticación de servicio a servicio es adecuada para publicar flujos de trabajo en Alteryx Server y Alteryx Analytics Hub.
Para obtener información sobre la configuración de credenciales, consulta las instrucciones en la documentación de Microsoft .
Clave compartida
Nota
La autenticación de clave compartida solo se puede utilizar con almacenamientos Gen2.
La publicación en Alteryx Server solo funcionará para Designer y Server 2020.4 y versiones más recientes, ya que este método de autenticación se incorporó a partir de la versión 2020.4.
Con una cuenta de almacenamiento de Azure, Microsoft genera dos claves de acceso que se pueden utilizar para autorizar el acceso a Azure Data Lake mediante la autorización de clave compartida. Puedes encontrar más información sobre la clave compartida y su uso en la documentación de Microsoft .
Nubes nacionales de Azure y puntos de conexión personalizados
A partir de la versión 2.0, los conectores de ADLS admiten el acceso a puntos de conexión personalizados. Las URL de las nubes nacionales de EE. UU. y China se pueden seleccionar en la pantalla de autenticación de los conectores en el campo Punto de conexión de autoridad de autenticación.
Configurar una aplicación de API personalizada de Microsoft Azure
Para configurar una aplicación de API personalizada para esta herramienta, consulta nuestra guía.
Opciones de selección y configuración de datos
En la pestaña Datos, puedes especificar los datos que deseas utilizar:
Especifica el nombre de cuenta de almacenamiento . Este almacenamiento debe ser del mismo tipo (Gen1, Gen2 respectivamente) que se seleccionó en la página Autenticación.
Para almacenamientos Gen2 , especifica el nombre del sistema de archivos .
Una vez que selecciones el sistema de almacenamiento y archivos para Gen2, puedes configurar la ruta del archivo que deseas leer o escribir. Puedes especificar la ruta, ya sea ingresándola directamente en el campo Ruta de archivo o mediante el explorador de archivos. Para la herramienta Salida de archivo de Azure Data Lake, puedes utilizar el mismo mecanismo a fin de crear un nuevo archivo.
Para los archivos de Excel, el nombre de la hoja se puede especificar en el campo Hoja ubicado debajo del explorador de archivos. Si se deja en blanco, se seleccionará la primera hoja automáticamente. En el caso de archivos nuevos, la hoja recibirá el nombre predeterminado “Hoja”.
Formatos de archivo y configuración
Las herramientas de ADLS admiten los siguientes formatos de datos: .csv, .avro, .json y .xlsx.
Archivos CSV
Leer
Escribir: Puedes sobrescribir un archivo CSV existente o agregarlo a uno.
Concejo
Para garantizar la compatibilidad con las herramientas Datos de entrada y de salida, la codificación debe ser UTF-8 SIG .
Archivos JSON
Leer: Para leer archivos JSON correctamente, deben utilizar la codificación UTF-8 sin BOM .
Escribir: La conversión del tipo de datos al escribir en archivos JSON tiene las siguientes limitaciones: las celdas Decimal, Fecha y hora, y Tiempo salen como cadenas .
Archivos de Avro
Leer
Escribir
Archivos de Excel
Leer: Todos los datos se leen como cadenas V_WString.
Escribir
Detalles adicionales
Si te encuentras sin acceso (lectura/escritura) a una determinada carpeta creada por otra cuenta, esto se debe a los permisos.
Si te encuentras con un error en el que se indica que el token se puede haber revocado, debes cerrar la sesión y regresar al panel de configuración para volver a autentificarte.
Nota
El administrador del sistema puede configurar las propiedades de vigencia del token.
Azure Data Lake Explorer debe conceder permisos para leer y escribir datos en una cuenta de Azure Data Lake Store. Para obtener más información sobre cómo se asignan y aplican estos permisos, consulta la documentación oficial de Microsoft.
Limitaciones
A partir de la versión 2.5.0 de las herramientas Azure Data Lake Store, la autenticación Gen1 dejará de ser compatible.
JSON y Avro son solo UTF-8
En el caso de JSON, existe un error de conversión silencioso si intentas almacenar valores demasiado grandes para su tipo de datos.
La escritura en los archivos de Excel se limita actualmente a una sobrescritura completa del archivo.
Los archivos de Avro con campos de tipo bytes no son compatibles y se producirá un error en la importación.
Los valores del campo flotante del flujo de trabajo de Alteryx se duplican en el archivo de Avro de destino.
Los conectores de Microsoft Azure Data Lake, OneDrive y Dynamics CRM admiten la autenticación mediante credenciales de usuario de Microsoft, como correo electrónico y contraseña. En los flujos de trabajo interactivos, actualmente no es posible realizar la autenticación con diferentes cuentas de usuario de Microsoft a través de estos conectores. Esta limitación no afecta a los flujos de trabajo programados. En el caso de que estés autenticado con una cuenta de usuario de Microsoft en uno de estos conectores e intentes autenticarte en otro conector con una cuenta de usuario de Microsoft distinta, verás un mensaje de error emergente. Para resolver este problema, sigue una de estas recomendaciones:
El administrador de Azure Active Directory puede conceder los permisos necesarios a una cuenta de usuario y asegurarse de que el usuario que cree el flujo de trabajo tenga una cuenta de usuario con acceso a los servicios necesarios en ese flujo de trabajo.
Cierra la sesión de cualquier conector que esté autenticado con una cuenta de usuario de Microsoft distinta antes de tratar de iniciar sesión.
Evita utilizar la autenticación de usuario final cuando sea posible. Utiliza la autenticación de servicio a servicio en los conectores de Azure Data Lake y la autenticación de inicio de sesión de la aplicación en los conectores de Dynamics CRM.
Desktop Automation (Programador) no es compatible con este conector.