Skip to main content

Amazon Redshift

Type de connexion

ODBC (64 bits)

Type de prise en charge

Lecture et écriture, En base de données

Validé le

Version de base de données : 1.0.35649

Version du client ODBC : 1.5.2.1002

Pour plus d'informations sur le pilote Simba Athena ODBC, consultez la documentation Simba ODBC .

Note

Pour éviter toute erreur lors de l'enregistrement de votre workflow sur Server, cochez la case Chiffrer le mot de passe pour : tous les utilisateurs de cet ordinateur dans Configuration DSN du pilote ODBC Simba Amazon Redshift .

Outils Alteryx utilisés pour la connexion

Traitement standard de workflow

Input Data Tool Icon
Output Data Tool Icon

Traitement de workflow en base de données

Blue icon with database being plugged in.
Blue icon with a stream-like object flowing into a database.

Authentification avec Azure AD

Alteryx permet une authentification de niveau entreprise pour Redshift, ce qui vous permet de tirer parti des identités Azure Active Directory lorsque vous accédez à vos données dans Redshift.

Conditions préalables :

  1. Intégration de la sécurité entre Azure Active Directory et Amazon Redshift.

  2. Accès provisionné par l'utilisateur Azure AD à l'instance AWS Redshift.

Pour en savoir plus sur l'intégration d'Azure AD à Redshift, consultez les articles de la communauté.

Configurer une connexion ODBC

Dans l'administrateur de source de données ODBC...

  1. Sélectionnez le pilote Redshift puis Configurer .

  2. Entrez vos Paramètres de connexion et vos informations d'identification.

  3. Dans la zone Options supplémentaires , sélectionnez l'option Récupérer les résultats entiers dans la mémoire .

    Note

    Ce paramètre permet de récupérer l'intégralité du Jeu de données dans la mémoire physique. Si la mémoire physique est limitée, ce paramètre est soumis à des modifications en fonction du volume de données et de la mémoire physique disponible, et vous devrez peut-être faire appel à votre administrateur de base de données pour obtenir un paramètre recommandé.

  4. Sélectionnez OK pour enregistrer la connexion.

Configurer une connexion en masse Amazon Redshift

Pour utiliser la connexion en masse via l'outil Sortie de données...

  1. Sélectionnez la liste déroulante Écrire dans un fichier ou une base de données , puis sélectionnez Autres bases de données > Connexion en masse Amazon Redshift .

  2. Sélectionnez un Nom de source de données (ou sélectionnez Administrateur ODBC pour en créer un). Voir Connexions aux bases de données ODBC et OLEDB.

  3. (Facultatif) Saisissez un Nom d'utilisateur et un Mot de passe .

  4. Dans la section Amazon S3 , entrez ou collez votre Clé d'accès AWS et la Clé secrète AWS pour accéder aux données pour le téléchargement.

  5. Dans la liste déroulante Chiffrement de la clé secrète , sélectionnez une option de chiffrement :

    • Masquer : masquer le mot de passe en utilisant un chiffrement minimal.

    • Chiffrer pour l'ordinateur  : tout utilisateur de l'ordinateur est en mesure d'utiliser pleinement la connexion.

    • Chiffrer pour l'utilisateur  : l'utilisateur connecté peut utiliser la connexion sur n'importe quel ordinateur.

  6. Dans la liste déroulante Point de terminaison , sélectionnez Par défaut pour permettre à Amazon de déterminer automatiquement le point de terminaison en fonction du compartiment sélectionné. Pour spécifier une extrémité pour les déploiements S3 privés, ou si vous connaissez une région de compartiment spécifique, vous pouvez sélectionner une extrémité (région S3), entrer une extrémité personnalisée ou en sélectionner une parmi dix extrémités personnalisées précédemment saisies.

    Si le compartiment sélectionné ne se trouve pas dans la région du point de terminaison spécifié, l'erreur suivante se produit : « Le compartiment auquel vous tentez d'accéder doit être adressé à l'aide du point de terminaison spécifié. Veuillez envoyer toutes les demandes futures à ce point de terminaison. » Sélectionnez Par défaut pour effacer l'erreur.

  7. (Facultatif) Sélectionnez Utiliser la signature V4 pour l’authentification pour utiliser Signature Version 4 au lieu de Signature Version 2 par défaut. La sécurité est ainsi renforcée, mais les vitesses de connexion peuvent être ralenties. Cette option est automatiquement activée pour les régions nécessitant Signature Version 4.

    Régions nécessitant Signature Version 4  : les régions créées après le 30 janvier 2014 prennent uniquement en charge Signature Version 4. Ces régions nécessitent une authentification avec Signature Version 4 :

    • Région Est des États-Unis (Ohio)

    • Région Canada (Central)

    • Région Asie-Pacifique (Bombay)

    • Région Asie-Pacifique (Séoul)

    • Région UE (Francfort)

    • Région UE (Londres)

    • Région Chine (Pékin)

  8. Sélectionnez une méthode de Chiffrement côté serveur pour le téléchargement vers un compartiment Amazon S3 chiffré. Pour plus d'informations sur les méthodes de chiffrement Amazon S3, consultez le Guide du développeur Amazon Simple Storage service .

    • Aucune (valeur par défaut) : aucune méthode de chiffrement n'est utilisée.

    • SSE-kms : utilisez le chiffrement côté serveur avec les clés gérées par AWS KMS. Au besoin, un ID de clé KMS peut être fourni. Lorsque vous sélectionnez cette méthode, l’option Utiliser la signature V4 pour l’authentification est activée par défaut.

  9. Dans la section Nom du compartiment , entrez le nom du compartiment AWS dans lequel sont stockés vos objets de données.

Sélectionnez l'option Utiliser Redshift Spectrum pour vous connecter aux tables Spectrum.

Cartographie du champ

Lors du chargement en bloc de données dans Amazon Redshift, les données sont écrites dans des champs incorrects lorsque l'ordre des champs dans la sortie du workflow est différent de celui de la base de données Redshift. Pour contourner ce problème :

  1. Sélectionnez l'option Ajouter la carte du champ dans l'outil Sortie de données pour la configurer, même si vous ne modifiez pas le paramètre par défaut. Dans le XML de workflow de l'outil Sortie de données, cela remplira la balise <AppendMapping mode="ByName" /> .

  2. Changez l' Option de sortie en Écraser la table (Supprimer) .

Configurer les options de sortie

Si vous le souhaitez, vous pouvez spécifier ou ajuster les options suivantes de Redshift. Pour plus d'informations, consultez le Guide du développeur de base de données Amazon Redshift .

Note

Pour créer des tables Spectrum avec l'outil Sortie de données, spécifiez le nom du schéma et de la table.

spectrum_schema.tablename

La clé de distribution est ignorée si l’option « Clé » n’est pas sélectionnée comme style de distribution. La clé de tri est ignorée si l’option « Aucun » n’est pas sélectionnée comme style de tri.

  • Clé primaire  : sélectionnez les colonnes pour la clé primaire et ajustez l'ordre des colonnes.

  • Style de distribution  : sélectionnez Homogène , Clé , ou Tous .

  • Clé de distribution  : sélectionnez une colonne pour la clé de distribution.

  • Style de tri  : sélectionnez Aucun , Composé ou Entrelacé .

  • Clé de tri  : sélectionnez des colonnes pour la clé de tri et ajustez l'ordre des colonnes.

  • Activer le vide et analyser les opérations : (connexions en masse uniquement) Option activée par défaut. Si cette option est activée, les commandes de maintenance VACUUM et ANALYZE sont exécutées après un chargement en masse APPEND dans la base de données Redshift.

  • Taille des segments du chargement en masse (1 Mo à 102 400 Mo) : pour augmenter les performances de téléchargement, les fichiers volumineux sont divisés en fichiers plus petits avec une taille d'entier spécifiée, en mégaoctets. La valeur par défaut est 128.

  • Activer la barre oblique inverse (\) en tant que caractère d'évasion : (connexions en masse uniquement) Option activée par défaut. Lorsque cette option est activée, le caractère qui suit la barre oblique inversée est considéré comme une donnée de colonne, même si ce caractère est habituellement utilisé dans un autre but (délimiteur, guillemet, saut de ligne, caractère d’échappement, etc.).

Important

Les identifiants sont repliés en minuscules dans la base de données. Dans les résultats des requêtes, les noms des tables et colonnes sont renvoyés par défaut en minuscules. Pour plus d'informations, consultez la documentation Noms et identifiants Amazon .

Problèmes connus

  • Lors de l'insertion d'un enregistrement dans une table Amazon Redshift avec une colonne contenant un attribut IDENTITY(seed, step), la valeur de la première colonne à insérer est nulle au lieu d'être transmise à l'outil Sortie de données.