Skip to main content

Microsoft Azure Data Lake Store

Tipo de conexión

Herramienta de Alteryx. La versión más reciente está disponible en Alteryx Marketplace .

Detalles del controlador

Según el método de inicio de sesión elegido, es posible que un administrador deba configurar el acceso a Azure Data Lake y Azure Active Directory antes de que se pueda establecer una conexión con las herramientas de Alteryx Azure Data Lake.

Tipo de soporte

Leer y escribir

Versión

Descripción

v2.5.0

  • Compatible con Alteryx Designer y Alteryx Server 2021.4.2 parche 6, 2022.1 parche 4 y versiones posteriores.

  • Requiere el uso de AMP Engine.

  • Alteryx Server requiere credenciales almacenadas en DCM para ejecutar los flujos de trabajo.

  • Se agregó una opción para descargar archivos localmente para procesarlos después.

  • Se eliminó el soporte para la autenticación Gen1.

  • Se corrigieron problemas relacionados con la autenticación DCM. (TPM-2462, TPM-2176)

  • Se corrigió un problema en que la entrada ADLS no leía correctamente los valores nulos. (TPM-3098, TPM-2659, TPM-2229)

  • Se corrigieron problemas en los que el flujo de trabajo no podía ejecutarse si las herramientas ADLS estaban configuradas para iniciar el procesamiento de datos en línea que no fueran 1. (TPM-2609, TPM-2277)

  • Se corrigió un problema en que la entrada ADLS ignoraba otros datos tras procesar un solo bucle de trozo. (TPM-2781)

  • Se corrigió un problema en que la entrada ADLS generaba un error de archivo CSV con formato incorrecto. (TPM-2175)

  • Se corrigió un problema en que la salida ADLS cambiaba los valores de fecha. (TPM-1928)

v2.4.3

  • Compatible con Alteryx Designer y Alteryx Server 2021.4.2 parche 4, 2022.1 parche 2 y versiones posteriores.

  • Compatible solo con AMP Engine.

  • Se incluyó la compatibilidad con DCM .

    • Se requiere DCM para ejecutar este conector en Alteryx Server.

  • Se puede utilizar FIPS.

  • Ahora, la validación mediante SSL/TLS se realiza en función del almacén de certificados de Windows.

  • Mejor rendimiento de escritura y estabilidad.

  • Se agregó la opción de ajustar el consumo de memoria y el rendimiento modificando la variable Cargar tamaño de trozo.

  • Se corrigió el problema que truncaba los datos XLSX cuando las celdas contenían más de 255 caracteres.

  • Se corrigió el problema con los caracteres que no son de Unicode en los certificados SSL.

  • Se corrigió el problema por el cual la herramienta Salida de ADLS agregaba caracteres de comillas dobles a pesar de que el campo Carácter de comillas estuviera configurado en Ninguno . (TPM-1964)

  • Mejoras de seguridad.

v2.2.0

  • Permite al usuario especificar un delimitador CSV personalizado en Salida.

  • Se corrigió una posible vulnerabilidad de XXE.

v2.1.0

  • Interfaz de usuario nueva y mejorada.

  • Se corrigieron problemas menores.

  • Compatible con Alteryx Designer y Server versión 2021.2 y posteriores.

v2.0

  • Se actualizó la IU y se mejoró el manejo de errores.

  • Se agregó compatibilidad con almacenamientos de Gen2.

  • Se agregó compatibilidad con Azure Government, la nube de China y puntos de conexión personalizados.

  • Compatibilidad con autenticación con clave compartida

  • Compatibilidad con aplicaciones públicas (propias y Alteryx)

  • Compatibilidad con capacidad multiinquilino

  • Compatibilidad con entrada y salida de Excel

  • Se agregó la capacidad de utilizar delimitadores personalizados para la lectura y escritura de archivos .csv.

  • Compatible con Alteryx Designer y Alteryx Server versión 2019.3 y posteriores.

v1.1.0

  • Se corrigieron errores de autenticación del usuario final.

  • Permite a los usuarios especificar un URI de redirección para la autenticación del usuario final.

v1.0.2

  • Opciones para actualizar página de código

  • Distingue entre codificaciones con el mismo idioma (p. ej., “Idioma” -> “Idioma [código específico]”) y codificaciones ordenadas alfabéticamente.

  • Permite al usuario especificar la codificación de archivos CSV en la herramienta de salida.

  • Se mejoró el mensaje de error para indicar cuando se proporciona un nombre de almacenamiento no válido.

  • Se mejoró el manejo de la conversión de datos para no mostrar una advertencia en vez de un error cuando falta un valor en un campo.

  • Se corrigió el error por el cual no se actualizan los archivos o carpetas mostrados después de que el usuario cambia el nombre del almacenamiento.

  • Se corrigió el problema en el que ocasionalmente no se respetaban los valores predeterminados.

  • Se deshabilitó el registro de producción a fin de evitar problemas de permisos para diferentes instalaciones/configuraciones de Designer y admitir la funcionalidad de flujos de trabajo programados.

v1.0.1

  • Se corrigió el problema que impedía que los paquetes se instalaran correctamente.

v1.0.0

  • Versión inicial de Entrada de archivo de Azure Data Lake y Salida de archivo de Azure Data Lake

Herramientas de Alteryx utilizadas para establecer conexiones

Administrador de conexiones de datos (DCM)

Las herramientas de Azure Data Lake Store versión 2.3.0 y posteriores admiten el Administrador de conexiones de datos para garantizar un almacenamiento más fácil y seguro de tus credenciales. Crea una conexión a Azure Data Lake Store y reutiliza con facilidad las credenciales almacenadas en flujos de trabajo que incluyen las herramientas de Azure Data Lake Store. Alteryx Server requiere credenciales almacenadas para ejecutar los flujos de trabajo publicados correctamente.

Habilitar AMP Engine

Asegúrate de tener habilitado AMP Engine para los flujos de trabajo que contienen las herramientas de Azure Data Lake Store versión 2.3.0 y posteriores.

Autenticación y autorización

Los puntos de conexión de Azure Data Lake para los almacenamientos Gen1 y Gen2 varían; durante la autenticación, debes especificar a qué tipo de almacenamiento deseas conectarte. En caso de que no estés seguro del tipo de almacenamiento que estás utilizando, puedes preguntarle al administrador de Azure o consultar el portal de Microsoft Azure .

SUGERENCIAS

  • Para publicar flujos de trabajo en Server o en AAH, utiliza los tipos de autenticación de servicio a servicio o de clave compartida, de modo que no tengas que volver a cargar el flujo de trabajo una vez que caduque el token de actualización.

  • Ya que la carga de los metadatos puede demorar mucho tiempo, puedes desactivar la carga de los metadatos seleccionando Deshabilitar la configuración automática en Configuración avanzada del usuario (Opciones > Configuración del usuario > Editar configuración del usuario > Avanzadas).

Debes tener permisos para leer y escribir datos en una cuenta de Azure Data Lake Store. Para obtener más información sobre cómo se asignan y aplican estos permisos, consulta la documentación oficial de Microsoft.

Comparación de un solo inquilino con multiinquilinos

Las aplicaciones de un solo inquilino están disponibles únicamente en el inquilino en el que se registraron, también conocido como el inquilino principal. Tú o tu administrador de Azure pueden crear aplicaciones y almacenamiento de Azure de un solo inquilino con tu cuenta que utilizarás durante la autenticación en Alteryx Designer. Las aplicaciones de varios inquilinos están disponibles para los usuarios tanto en su inquilino principal como en los demás inquilinos.

Usuario final (básico)

La autenticación del usuario final básica es la forma más cómoda de acceder a los datos de ADLS en Designer. Comunícate con el administrador de Azure para permitir aplicaciones públicas de Alteryx en el inquilino de Azure de la organización. Consulta la documentación de Microsoft en la que se describen los pasos .

Inquilino: común

Id. de cliente de ADLS para la aplicación Alteryx Gen2: 2584cace-63ff-47cb-96d2-d153704f4d75

Después de esta configuración, tanto tú como tus colegas podrán utilizar sus credenciales normales de Microsoft para acceder a los datos de ADLS.

Usuario final (avanzado)

La autenticación de usuario final avanzada admite la autenticación de uno y varios inquilinos, y se puede utilizar con aplicaciones públicas y privadas.

Para obtener información sobre la configuración de credenciales, consulta las instrucciones en la documentación de Microsoft .

Configuración de autenticación

  • Id. de inquilino: Puedes obtener el Id. de inquilino en el portal de Azure o confiar en el mecanismo de detección automática de Azure escribiendo “common” en el campo Id. de inquilino. En caso de acceso a multiinquilinos, puedes especificar el Id. de inquilino. Para obtener más información acerca de los multiinquilinos, consulta la sección Comparación de un solo inquilino con multiinquilinos

  • Id. de cliente: El identificador único de una aplicación de Azure. El campo Id. de cliente es obligatorio.

  • Secreto de cliente: Si tu aplicación es privada, es obligatorio proporcionar un secreto del cliente. Si utilizas una aplicación pública, deja el campo vacío.

Servicio a servicio

La autenticación de servicio a servicio es adecuada para publicar flujos de trabajo en Alteryx Server y Alteryx Analytics Hub.

Para obtener información sobre la configuración de credenciales, consulta las instrucciones en la documentación de Microsoft .

Clave compartida

Nota

  • La autenticación de clave compartida solo se puede utilizar con almacenamientos Gen2.

  • La publicación en Alteryx Server solo funcionará para Designer y Server 2020.4 y versiones más recientes, ya que este método de autenticación se incorporó a partir de la versión 2020.4.

Con una cuenta de almacenamiento de Azure, Microsoft genera dos claves de acceso que se pueden utilizar para autorizar el acceso a Azure Data Lake mediante la autorización de clave compartida. Puedes encontrar más información sobre la clave compartida y su uso en la documentación de Microsoft .

Nubes nacionales de Azure y puntos de conexión personalizados

A partir de la versión 2.0, los conectores de ADLS admiten el acceso a puntos de conexión personalizados. Las URL de las nubes nacionales de EE. UU. y China se pueden seleccionar en la pantalla de autenticación de los conectores en el campo Punto de conexión de autoridad de autenticación.

Configurar una aplicación de API personalizada de Microsoft Azure

Para configurar una aplicación de API personalizada para esta herramienta, consulta nuestra guía.Configurar la aplicación de API de Microsoft Azure

Opciones de selección y configuración de datos

En la pestaña Datos, puedes especificar los datos que deseas utilizar:

  1. Especifica el nombre de cuenta de almacenamiento . Este almacenamiento debe ser del mismo tipo (Gen1, Gen2 respectivamente) que se seleccionó en la página Autenticación.

  2. Para almacenamientos  Gen2 , especifica el nombre del sistema de archivos .

  3. Una vez que selecciones el sistema de almacenamiento y archivos para Gen2, puedes configurar la ruta del archivo que deseas leer o escribir. Puedes especificar la ruta, ya sea ingresándola directamente en el campo Ruta de archivo o mediante el explorador de archivos. Para la herramienta Salida de archivo de Azure Data Lake, puedes utilizar el mismo mecanismo a fin de crear un nuevo archivo.

  4. Para los archivos de Excel, el nombre de la hoja se puede especificar en el campo Hoja ubicado debajo del explorador de archivos. Si se deja en blanco, se seleccionará la primera hoja automáticamente. En el caso de archivos nuevos, la hoja recibirá el nombre predeterminado “Hoja”.

Formatos de archivo y configuración

Las herramientas de ADLS admiten los siguientes formatos de datos: .csv, .avro, .json y .xlsx.

  • Archivos CSV

    • Leer

    • Escribir: Puedes sobrescribir un archivo CSV existente o agregarlo a uno.

Concejo

Para garantizar la compatibilidad con las herramientas Datos de entrada y de salida, la codificación debe ser UTF-8 SIG .

  • Archivos JSON

    • Leer: Para leer archivos JSON correctamente, deben utilizar la codificación UTF-8 sin BOM .

    • Escribir: La conversión del tipo de datos al escribir en archivos JSON tiene las siguientes limitaciones: las celdas Decimal, Fecha y hora, y Tiempo salen como cadenas .

  • Archivos de Avro

    • Leer

    • Escribir

  • Archivos de Excel

    • Leer: Todos los datos se leen como cadenas V_WString.

    • Escribir

Detalles adicionales

  • Si te encuentras sin acceso (lectura/escritura) a una determinada carpeta creada por otra cuenta, esto se debe a los permisos.

  • Si te encuentras con un error en el que se indica que el token se puede haber revocado, debes cerrar la sesión y regresar al panel de configuración para volver a autentificarte.

Nota

El administrador del sistema puede configurar las propiedades de vigencia del token.

Azure Data Lake Explorer debe conceder permisos para leer y escribir datos en una cuenta de Azure Data Lake Store. Para obtener más información sobre cómo se asignan y aplican estos permisos, consulta la documentación oficial de Microsoft.

Limitaciones

A partir de la versión 2.5.0 de las herramientas Azure Data Lake Store, la autenticación Gen1 dejará de ser compatible.

JSON y Avro son solo UTF-8

En el caso de JSON, existe un error de conversión silencioso si intentas almacenar valores demasiado grandes para su tipo de datos.

La escritura en los archivos de Excel se limita actualmente a una sobrescritura completa del archivo.

Los archivos de Avro con campos de tipo bytes no son compatibles y se producirá un error en la importación.

Los valores del campo flotante del flujo de trabajo de Alteryx se duplican en el archivo de Avro de destino.

Los conectores de Microsoft Azure Data Lake, OneDrive y Dynamics CRM admiten la autenticación mediante credenciales de usuario de Microsoft, como correo electrónico y contraseña. En los flujos de trabajo interactivos, actualmente no es posible realizar la autenticación con diferentes cuentas de usuario de Microsoft a través de estos conectores. Esta limitación no afecta a los flujos de trabajo programados. En el caso de que estés autenticado con una cuenta de usuario de Microsoft en uno de estos conectores e intentes autenticarte en otro conector con una cuenta de usuario de Microsoft distinta, verás un mensaje de error emergente. Para resolver este problema, sigue una de estas recomendaciones:

  • El administrador de Azure Active Directory puede conceder los permisos necesarios a una cuenta de usuario y asegurarse de que el usuario que cree el flujo de trabajo tenga una cuenta de usuario con acceso a los servicios necesarios en ese flujo de trabajo.

  • Cierra la sesión de cualquier conector que esté autenticado con una cuenta de usuario de Microsoft distinta antes de tratar de iniciar sesión.

  • Evita utilizar la autenticación de usuario final cuando sea posible. Utiliza la autenticación de servicio a servicio en los conectores de Azure Data Lake y la autenticación de inicio de sesión de la aplicación en los conectores de Dynamics CRM.

Desktop Automation (Programador) no es compatible con este conector.