Amazon Redshift

Tipo de conexión

ODBC (64 bits)

Tipo de soporte

Lectura y escritura; en base de datos

Se validó en

Versión de base de datos: 1.0.35649

Versión del cliente ODBC: 1.5.2.1002

Versión del controlador ODBC: 2.01.06.00

Para obtener más información sobre el controlador ODBC de Simba, consulta la documentación de ODBC de Simba.

Para obtener más información sobre el controlador ODBC de Amazon, consulta la documentación de ODBC de Amazon.

Nota

Para evitar errores cuando guardes tu flujo de trabajo en Server, selecciona la casilla de verificación Cifrar contraseña para todos los usuarios de esta máquina en Configuración del DNS del controlador ODBC de Simba Amazon Redshift.
Para conexiones sin DSN, utiliza el controlador Simba Amazon Redshift o el controlador nativo Amazon Redshift versión 2.x.

Herramientas de Alteryx utilizadas para establecer conexiones

Procesamiento de flujos de trabajo estándares

Procesamiento de flujos de trabajo en base de datos

Métodos de autenticación admitidos

Herramienta	Autenticación básica	Rol de IAM	OAuth genérico
Lectura/escritura	SI	IAM con Cognito	SI
En-BD	SI	IAM con Cognito	SI
Masivo	SI	IAM con Cognito	SI

OAuth con grupo de identidades para Redshift

OAuth con grupo de identidades para Redshift solo está disponible con DCM. Para obtener más información, consulta Aprovechar la autenticación basada en AWS Cognito para Redshift (Comunidad Alteryx).

Autenticación de Azure AD

Alteryx habilita el método de autenticación de nivel empresarial de Redshift, lo que te permite aprovechar las identidades de Azure Active Directory cuando accedes a tus datos en Redshift.

Requisitos previos:

Integración de seguridad entre Azure Active Directory y Amazon Redshift.
El usuario de Azure AD aprovisionó el acceso a la instancia de AWS Redshift.

Para obtener más información sobre cómo integrar Azure AD en Redshift, consulta los artículos de la Comunidad.

Configurar una conexión ODBC

En el administrador de fuentes de datos ODBC:

Selecciona el controlador de Redshift y, luego, selecciona Configurar.
Ingresa tu Configuración de conexión y las credenciales.
En el área Opciones adicionales, selecciona la opción Recuperar resultados enteros en memoria.
Nota
Esta configuración recupera todo el conjunto de datos en la memoria física. Si la memoria física es poca, este ajuste está sujeto a cambios según el volumen de datos y la memoria física disponible, y es posible que debas solicitar ayuda al administrador de base de datos (DBA) para que recomiende el ajuste.
Selecciona Aceptar para guardar la conexión.

Configurar una conexión masiva de Amazon Redshift

Con Designer 2024.1, la conexión masiva de Redshift admite la autenticación de IAM (Identity and Access Management) de AWS.

Para utilizar la conexión masiva a través de la herramienta Datos de salida:

Haz clic en el menú desplegable Escribir en archivo o en base de datos y selecciona Otras bases de datos > Carga masiva de Amazon Redshift.
Selecciona un Nombre de fuente de datos (o selecciona Administrador de ODBC para crear uno). Para obtener más información, consulta las Conexiones de bases de datos ODBC y OLEDB.
(Opcional) Ingresa un Nombre de usuario y una Contraseña.
En la sección Amazon S#, escribe o pega la Clave de acceso de AWS y la Clave secreta de AWS a fin de acceder a los datos para su carga.
En la lista desplegable Cifrado de clave secreta, selecciona una opción de cifrado:
- Ocultar: oculta la contraseña utilizando un cifrado mínimo.
- Cifrar para el equipo: cualquier usuario en la computadora será capaz de utilizar por completo la conexión.
- Cifrar para el usuario: el usuario que inició sesión puede utilizar la conexión en cualquier computadora.
En la lista desplegable Punto de conexión, selecciona Predeterminado para permitir que Amazon determine de manera automática el punto de conexión según el bucket seleccionado. Para especificar un punto de conexión para las implementaciones privadas de S3 o si conoces un bucket de una región específica, puedes seleccionar un punto de conexión (región S3), introducir un punto de conexión final personalizado o seleccionar uno de los diez puntos de conexión personalizados introducidos previamente.
Si el bucket seleccionado no se encuentra en el punto de conexión especificado, se produce el siguiente error: “El bucket al que intentas acceder debe dirigirse con el punto de conexión especificado. Envía todas las solicitudes futuras a este punto de conexión”. Selecciona Predeterminado para borrar el error.
(Opcional) Selecciona Utilizar Signature V4 para la autenticación a fin de utilizar Signature Version 4 en lugar de la versión Signature Version 2 predeterminada. Esto aumenta la seguridad, pero las velocidades de conexión pueden ser más lentas. Esta opción se activa automáticamente para las regiones que requieren la versión Signature V4.
Regiones que requieren Signature Version 4: las regiones creadas después del 30 de enero de 2014 solo admiten Signature Version 4. Las siguientes regiones requieren autenticación de Signature Version 4:
- Región del este de los EE. UU. (Ohio)
- Región de Canadá (central)
- Región de Asia Pacífico (Mumbai)
- Región de Asia Pacífico (Seúl)
- Región de la UE (Frankfurt)
- Región de la UE (Londres)
- Región de China (Beijing)
Selecciona un método de Cifrado en el lado del servidor para subir a un depósito de Amazon S3 cifrado. Para obtener más información sobre los métodos de cifrado de Amazon S3, consulta la Guía para desarrolladores de Amazon Simple Storage Service.
- Ninguno (predeterminado): no se utiliza ningún método de cifrado.
- SSE-KMS: utiliza el cifrado del servidor con las claves administradas por AWS KMS. Opcionalmente proporciona una ID de clave de KMS. Al seleccionar este método, la opción Usar la firma V4 para la autenticación está habilitada de forma predeterminada.
En Nombre de bucket, ingresa el nombre del bucket de AWS en el que se almacenan tus objetos de datos.

Opcionalmente selecciona Usar Redshift Spectrum para conectarse a tablas Spectrum.

Asignación de campos

Cuando se cargan datos de forma masiva en Amazon Redshift, los datos se escriben en campos incorrectos cuando el orden de los campos en la salida del flujo de trabajo es diferente del de la base de datos de Redshift. Sigue estos pasos para solucionarlo:

Selecciona la opción Agregar mapa de campos en la herramienta Datos de salida para configurarlos, incluso si no cambias la configuración predeterminada. En el XML del flujo de trabajo de la herramienta Datos de salida, esto rellenará la etiqueta <AppendMapping mode="ByName" />.
Cambia la opción de salida a Sobrescribir tabla (descartar).

Configurar opciones de salida

Tienes la opción de especificar o ajustar las siguientes opciones de Redshift. Para obtener más información, consulta la Guía de desarrolladores de bases de datos de Amazon Redshift.

Nota

Para crear tablas Spectrum con la herramienta Datos de salida, especifica el nombre de esquema y de la tabla.

spectrum_schema.tablename

La clave de distribución se ignora si no se selecciona 'Clave' para el estilo de distribución. La clave de ordenamiento se ignora si se selecciona 'Ninguno' para el estilo de ordenamiento.

Clave principal: selecciona las columnas para la clave principal y ajusta el orden de las columnas.
Estilo de distribución: selecciona Uniforme, Clave o Todos.
Clave de distribución: selecciona una columna para la Clave de distribución.
Estilo de ordenamiento: selecciona Ninguno, Compuesto o Intercalado.
Clave de ordenamiento: selecciona las columnas para la clave de ordenamiento y ajusta el orden de las columnas.
Habilitar operaciones de Vacuum y Analize: (solo conexiones masivas) habilitado de forma predeterminada. Cuando está activada esta opción, los comandos de mantenimiento VACUUM y ANALYZE se ejecutan después de añadir (APPEND) una carga masiva a la base de datos de Redshift.
Tamaño de los trozos de carga masiva (1 MB a 102400 MB): para aumentar el rendimiento de carga, los archivos grandes se dividen en archivos más pequeños con un tamaño especificado en megabytes. El valor predeterminado es 128.
Habilita la barra invertida (\) como carácter de escape: (solo conexiones masivas) habilitado de forma predeterminada. Cuando está habilitado, un carácter que sigue inmediatamente a un carácter de barra invertida se carga como dato de columna, incluso si ese carácter normalmente se utiliza para un propósito especial (por ejemplo, carácter delimitador, comillas, carácter de nueva línea incrustada o carácter de escape).

Importante

Los identificadores se pasan a minúsculas en la base de datos. En los resultados de consultas, las tablas y los nombres de columnas se muestran en minúsculas de forma predeterminada. Para obtener más información, consulta Nombres e identificadores de Amazon.

Nota

Define puntos de conexión STS personalizados de AWS y la configuración de puntos de conexión privados para los casos de conectores de AWS compatibles. El Administrador de conexiones de datos (DCM) permite anular los puntos de conexión para que la recuperación de credenciales y las operaciones de los conectores utilicen de forma coherente los puntos de conexión especificados. Cuando se configura un punto de conexión privado, todo el tráfico entre Alteryx y AWS permanece dentro de redes privadas, sin recurrir a puntos de conexión públicos de Internet.

Problemas conocidos

Cuando se inserta un registro en una tabla de Amazon Redshift con una columna que contiene un atributo IDENTITY(seed, step), el valor de la primera columna que se inserta es nulo, en lugar del valor que recibe la herramienta Datos de salida.
El servidor de Redshift no admite la ejecución de varias consultas en una sola instrucción preparada.

En esta sección:

Amazon Redshift

Herramientas de Alteryx utilizadas para establecer conexiones

Procesamiento de flujos de trabajo estándares

Procesamiento de flujos de trabajo en base de datos

Métodos de autenticación admitidos

OAuth con grupo de identidades para Redshift

Autenticación de Azure AD

Configurar una conexión ODBC

Configurar una conexión masiva de Amazon Redshift

Asignación de campos

Configurar opciones de salida

Problemas conocidos

Resultados de la búsqueda