Connexions en masse Teradata
La connexion en bloc Teradata est utilisée pour lire et écrire de gros volumes de données à grande vitesse vers une table vide sur une base de données Teradata via le Outil Entrée de données et Outil Sortie de données. En plus d'être vide, la table cible ne peut pas avoir défini d'index secondaires. L'utilisateur doit avoir sélectionné et insérer des privilèges sur la table cible, sélectionner et insérer des privilèges sur les tables d'erreur et supprimer les privilèges de la base de données contenant les tables d'erreur.
Les outils et utilitaires Teradata suivants doivent être installés sur l’ordinateur (la version recommandée pour ces outils est la dernière version 14.0).
- Partagé Bibliothèques ICU
- ODBC Driver pour Teradata
- Teradata Client GSS
- Teradata Parallel Transporter Base
Pour plus d'informations sur Teradata, consultez leur site Web à: www.Teradata.com
-
Source de donnéesde sortie: utilisez la liste déroulante pour sélectionner d'autres bases de données > Teradata Bulk.
-
Teradata nom de la source de données: Utilisez la liste déroulante de connexions ODBC disponibles configurées sur l’ordinateur.
-
Nomd'utilisateur: spécifiez les informations d'identification du nom d'utilisateur pour la connexion à Teradata
-
Mot de passe: spécifiez les informations d'identification de mot de passe pour la connexion à Teradata
- Configurer les options de connexion :
- Authentification LDAP: si le serveur Teradata utilise LDAP pour l'authentification, vous devez sélectionner cette option. Vous devez aussi sélectionner LDAP comme mécanisme d’authentification du DSN dans la configuration du pilote ODBC. (L’option LDAP doit être sélectionnée ou désélectionnée aux deux emplacements).
- Activer le cryptage des données: sélectionnez cette option pour crypter les données pendant le transfert. Vous devez activer séparément le chiffrement du DSN dans les options du pilote ODBC (c.-à-d. pour la création et la suppression de tables).
-
Configurer les options de l’outil Sortie de données :
-
Max Records par fichier: spécifiez la limite des enregistrements à écrire. Laissez blanc si le nombre est illimité.
-
Format de fichier: Teradata Bulk Loader format.
-
Mots de passe: utilisez la liste déroulante pour spécifier comment gérer l'affichage du mot de passe dans la fenêtre de configuration. Plusieurs choix sont possibles :
-
Masquer (par défaut)
-
Chiffrer pour l'ordinateur
-
Chiffrer pour l’utilisateur
-
Options de sortie: utilisez la liste déroulante pour spécifier comment les données doivent être écrites dans Teradata. Plusieurs choix sont possibles :
-
Créer une nouvelle table: écrit des données dans une nouvelle table. Aucune table existante n’est écrasée.
-
Remplacer une table (Drop): supprime complètement la table existante et en crée une nouvelle.
-
Append (ignorer les lignes dupliquées): ajoute des données dans une table existante tout en ignorant les enregistrements en double.
-
Append (marquer les lignes dupliquées): les lignes dupliquées entrent dans TableName_e2
-
Delete & append: supprime tous les enregistrements originaux de la table, puis ajoute les données dans la table existante.
-
Limite d'erreur: ce paramètre mettra fin à l'écriture des enregistrements si le nombre d'erreurs dépasse cette limite. Tous les enregistrements déjà écrits resteront dans la table.
-
Autre nom pour les tables d'erreur et de journal: le chargeur en vrac Teradata utilise l'API du transporteur parallèle Teradata pour écrire les données. L'API crée automatiquement 3 tables. Ces tables seront par défaut le nom de la table si le nombre de caractères dans le nom est inférieur à 27. Si le nombre de caractères est supérieur à 27, vous devrez entrer un autre nom de table pour ces tables.
-
Pre Create SQL Statement: instruction SQL qui sera exécutée via OLEDB avant la création de la table de sortie. Connaissance avancée du langage SQL requis.
-
Post Create SQL Statement: instruction SQL qui sera exécutée via OLEDB après la création de la table de sortie. Connaissance avancée du langage SQL requis.
-
Style de table/nom de champ: les choix incluent cité ou aucun. L’option Entre guillemets lance une recherche d’identifiant de guillemet pour le type de base de données.
Les tables créées par le Teradata Bulk Loader sont "tablename_lg", "tablename_e1" et "tablename_e2". (où tablename est le nom que vous avez entré dans 6 ou 7) Si des erreurs se produisent lors de la rédaction des enregistrements, ces tableaux auront l'information sur ces échecs. Alteryx supprimera automatiquement ces tables de travail, sur Delete Data & Append, et remplacera table (Drop).
- Source de données d'entrée: utilisez la liste déroulante pour sélectionner d'autres bases de données > Teradata Bulk.
- Teradata nom de la sourcede données: utilisez la liste déroulante des connexions ODBC disponibles configurées sur l'ordinateur.
- Nomd'utilisateur: spécifiez les informations d'identification du nom d'utilisateur pour la connexion à Teradata
- Mot de passe: spécifiez les informations d'identification de mot de passe pour la connexion à Teradata
- Configurer les options de connexion :
- Authentification LDAP: si le serveur Teradata utilise LDAP pour l'authentification, vous devez sélectionner cette option. Vous devez aussi sélectionner LDAP comme mécanisme d’authentification du DSN dans la configuration du pilote ODBC. (L’option LDAP doit être sélectionnée ou désélectionnée aux deux emplacements).
- Activer le cryptage des données: sélectionnez cette option pour crypter les données pendant le transfert. Vous devez activer séparément le chiffrement du DSN dans les options du pilote ODBC (c.-à-d. pour la création et la suppression de tables).
- Configurer les options de l’outil Entrée de données :
- Limited'enregistrement: saisissez le numéro pour limiter les enregistrements lus à partir de la source de données d'entrée. Cela peut être utile pour effectuer différents types de tests. Laissez blanc pour lire tous les enregistrements.
- Format de fichier: Teradata Bulk Loader format.
- Mots de passe: utilisez la liste déroulante pour spécifier comment gérer l'affichage du mot de passe dans la fenêtre de configuration. Plusieurs choix sont possibles :
- Masquer (par défaut)
- Chiffrer pour l'ordinateur
- Chiffrer pour l’utilisateur
- Table ou requête: spécifiez le nom de la table cible dans laquelle les enregistrements seront lus. Cliquez sur pour obtenir une liste des tables.
- Lecturesans spoule: paramètre Teradata-spécifie s'il faut utiliser spool ou non lors de l'exécution du travail d'exportation en cours.
- Ne montrez pas% complet: une fois coché, Alteryx n'essaiera pas de signaler l'état de lecture dans le fichier, accélérant ainsi l'heure de lecture.
- Pre Create SQL Statement: instruction SQL qui sera exécutée via OLEDB avant la lecture de la table. Connaissance avancée du langage SQL requis.
- Post Create SQL Statement: une instruction SQL qui sera exécutée via OLEDB après la lecture de la table. Connaissance avancée du langage SQL requis.
- Style de table/nom de champ: les choix incluent cité ou aucun. L’option Entre guillemets lance une recherche d’identifiant de guillemet pour le type de base de données.
Précise s’il faut utiliser une file d’attente ou non lors de l’exécution du job d’exportation en cours.
Valeurs valides
- "spool" = utiliser la bobine. Paramètre par défaut.
- "nospool" = n'utilisez pas la bobine. Cette valeur est correcte si DBS prend en charge NoSpool. Si DBS ne prend pas en charge NoSpool, il utilise Spool à la place.
- "NoSpoolOnly" = ne pas utiliser de bobine dans tous les cas. Si DBS ne prend pas en charge NoSpool, il met fin à la tâche en générant une erreur.
Options de bobinage
Le mode NoSpool exporte le contenu d’une table aussi rapidement que possible sans lire la table dans un fichier en file d’attente ou sans distribuer le fichier vers tous les AMP avant de l’extraire.
- dÉfaut Bobinez les données.
- Utilisez le mode NOSPOOLONLY, mais renvoyez une erreur si nospool n'est pas pris en charge.
- Utilisez le mode nospool lorsque cela est possible; Sinon, enroulez les données dans la base de données Teradata.
Restrictions et fonctionnalités
- Le mode nospool s'applique uniquement aux instructions SELECT simples. Les fonctionnalités suivantes ne sont pas prises en charge :
- Accès à des tables non-données, telles que SELECT date ou Select utilisateur
- Utilisation du modificateur; Définissez plutôt des paramètres de contrainte à l'aide d'une commande d'importation FastExport avec des commandes de champ et de remplissage de support
- Contient un tri (Order By), ayant ou avec des clauses
- Rejoint
- Agrégations (expliquer montre l'étape Sum)
- Fonctions de table
- Fonctions analytiques ordonnées (OLAP)
- Plusieurs instructions SELECT ou requêtes multiétates
- Instructions avec zéro ou plus d'un, extraction ou étape d'échantillonnage
- Le mode nospool ne récupère que les données d'une seule table, mais l'instruction SELECT peut être sélective sur les colonnes qui sont exportées et peut contraindre le travail à un sous-ensemble de lignes.
- Les expressions/fonctions scalaires sont autorisées.
- Les contraintes d'élimination de l'échantillon et de la partition sont prises en charge.
- Le nombre d'activités retourné pour un travail en attente régulier indique le numéro des blocs affectés; Toutefois, pour les travaux sans spoule, le nombre de blocs est inconnu, de sorte que le message de réponse contient ActivityType (au lieu du nombre d'activités) pour indiquer le processus nospool.
Inconvénients du mode NOSPOOL
- Les verrous sont maintenus pendant tout le processus d'exportation.
- Les erreurs de conversion de données précédemment détectées au cours de la phase de mise en file d'attente ne seront pas détectées tant que le bloc n'est pas lu, ce qui pourrait se produire à tout moment pendant l'exportation.
- L'ordre des lignes (en raison de l'absence de la clause ORDER BY) peut ou peut ne pas être cohérent entre les exécutions; par conséquent, le mode nospool n'offre aucune garantie de cohérence.
Voir les informations sur le mode spool/nospool, Teradata FastExport Référence.