Teradata Bulk-Verbindungen

Die Teradata Bulk-Verbindung wird verwendet, um große Datenvolumen zu lesen und in hoher Geschwindigkeit in eine leere Tabelle einer Teradata-Datenbank zu schreiben. Hierbei kommen das Eingabedaten-Tool und das Datenausgabe-Tool zum Einsatz. Die Tabelle muss nicht nur leer sein, für sie können auch keine Sekundärindizes definiert werden. Der Benutzer benötigt SELECT- und INSERT-Berechtigungen für die Zieltabelle, SELECT- und INSERT-Berechtigungen für die Fehlertabellen sowie DROP-Berechtigungen für die Datenbank, in der sich die Fehlertabellen befinden.

Folgende Teradata-Tools und -Dienstprogramme müssen auf dem Computer installiert sein (die aktuellste Version ist 14.0 und wird für diese Tools empfohlen).

Freigegebene ICU-Bibliotheken
ODBC-Treiber für Teradata
Teradata GSS-Client
Teradata Parallel Transporter-Basis

Weitere Informationen zu Teradata finden Sie auf der Website: www.teradata.com

Verwenden Sie das Datenausgabe-Tool zum Schreiben in eine Teradata Bulk-Verbindung.

Datenquelle ausgeben: Wählen Sie im Auswahlmenü Andere Datenbanken > Teradata Bulk aus.
Teradata-Datenquellenname: Wählen Sie im Auswahlmenü eine der auf dem Computer eingerichteten verfügbaren ODBC-Verbindungen aus.
Benutzernamen: Geben Sie den Benutzernamen für die Verbindung zu Teradata an.
Kennwort: Geben Sie das Kennwort für die Verbindung zu Teradata an.
Konfigurieren von Verbindungsoptionen:
- LDAP-Authentifizierung: Wenn der Teradata-Server LDAP für die Authentifizierung verwendet, müssen Sie diese Option auswählen. Zudem müssen Sie LDAP als DSN-Authentifizierungsmechnismus in der ODBC-Treiberkonfiguration auswählen. (LDAP muss an beiden Orten aus- oder abgewählt sein).
- Datenverschlüsselung: Wählen Sie diese Option aus, um die Daten während der Übertragung zu verschlüsseln. Dabei müssen Sie die DSN-Verschlüsselung separat in den ODBC-Treiberoptionen aktivieren (d. h., zum Erstellen und Verwerfen von Tabellen).
Konfiguration der Optionen des Tools „Ausgabedaten“:
1. Max. Datensätze pro Datei: Legen Sie die maximale Anzahl der zu schreibenden Datensätze fest. Wenn Sie keine Angabe machen, erfolgt keine Einschränkung.
2. Dateiformat: Teradata Bulk-Loader-Format.
3. Kennwörter: Wählen Sie im Auswahlmenü aus, wie Kennwörter im Konfigurationsfenster angezeigt werden. Zur Auswahl stehen:
  - Ausblenden (Standard)
  - Für Rechner verschlüsseln
  - Für Benutzer verschlüsseln
4. Ausgabeoptionen: Wählen Sie im Auswahlmenü aus, wie die Daten in Teradata geschrieben werden. Zur Auswahl stehen:
  - Neue Tabelle erstellen: Schreibt Daten in eine neue Tabelle. Überschreibt keine vorhandene Tabelle.
  - Tabelle überschreiben (verwerfen): Verwirft die vorhandene Tabelle vollständig und erstellt eine neue Tabelle.
  - Anhängen (Doppelte Zeilen ignorieren): Fügt Daten zu einer vorhandenen Tabelle hinzu und ignoriert dabei doppelte Datensätze.
  - Anhängen (Doppelte Zeilen kennzeichnen): Doppelte Zeilen werden in „Tabellenname_e2“ abgelegt.
  - Löschen und anhängen: Löscht alle ursprünglichen Datensätze aus der Tabelle und hängt anschließend die Daten in der vorhandenen Tabelle an.
5. Fehlergrenze: Diese Einstellung beendet das Schreiben von Datensätzen, wenn die Anzahl der Fehler diese Grenze überschreitet. Alle bereits geschriebenen Datensätze verbleiben in der Tabelle.
6. Alternativer Name für Protokoll- und Fehlertabellen: Der Teradata Bulk-Loader verwendet die Teradata Parallel Transporter-API, um die Daten zu schreiben. Die API erstellt automatisch 3 Tabellen. Diese Tabellen erhalten den Standardtabellennamen, wenn die Anzahl der im Namen enthaltenen Zeichen kleiner als 27 ist. Wenn die Anzahl der Zeichen größer als 27 ist, müssen Sie für die Tabelle einen alternativen Tabellennamen eingeben.
7. SQL-Anweisung vor Erstellen: SQL-Anweisung, die über OleDB ausgeführt wird, BEVOR die Ausgabetabelle erstellt wird. Erweiterte SQL-Kenntnisse erforderlich.
8. SQL-Anweisung nach Erstellen: SQL-Anweisung, die über OleDB ausgeführt wird, NACHDEM die Ausgabetabelle erstellt wurde. Erweiterte SQL-Kenntnisse erforderlich.
9. Tabellen-/Feldnamenstil: Zur Auswahl stehen „In Anführungszeichen“ und „Keiner“. Mit „In Anführungszeichen“ wird für den Datenbanktyp ein Bezeichner in Anführungszeichen gesucht.

Die vom Teradata Bulk Loader erstellten Tabellen sind „Tabellenname_lg“, „Tabellenname_e1“ und „Tabellenname_e2“. „Tabellenname“ steht dabei für den in Schritt 6 oder 7 eingegebenen Namen. Wenn beim Schreiben von Datensätzen Fehler auftreten, finden Sie die Informationen zu diesen Fehlern in diesen Tabellen. Alteryx entfernt diese Arbeitstabellen automatisch, wenn „Daten löschen und anhängen“ und „Tabelle überschreiben (verwerfen)“ ausgewählt wird.

Verwenden Sie das Eingabedaten-Tool zum Lesen von Dateien über eine Teradata Bulk-Verbindung.

Datenquelle eingeben: Wählen Sie im Auswahlmenü Andere Datenbanken > Teradata Bulk aus.
Teradata-Datenquellenname: Wählen Sie im Auswahlmenü eine der auf dem Computer eingerichteten verfügbaren ODBC-Verbindungen aus.
Benutzernamen: Geben Sie den Benutzernamen für die Verbindung zu Teradata an.
Kennwort: Geben Sie das Kennwort für die Verbindung zu Teradata an.
Konfigurieren von Verbindungsoptionen:
- LDAP-Authentifizierung: Wenn der Teradata-Server LDAP für die Authentifizierung verwendet, müssen Sie diese Option auswählen. Zudem müssen Sie LDAP als DSN-Authentifizierungsmechnismus in der ODBC-Treiberkonfiguration auswählen. (LDAP muss an beiden Orten aus- oder abgewählt sein).
- Datenverschlüsselung: Wählen Sie diese Option aus, um die Daten während der Übertragung zu verschlüsseln. Dabei müssen Sie die DSN-Verschlüsselung separat in den ODBC-Treiberoptionen aktivieren (d. h., zum Erstellen und Verwerfen von Tabellen).
Konfiguration der Optionen des Tools „Eingabedaten“:
1. Datensatzgrenze: Geben Sie die Anzahl der Datensätze ein, die aus der Eingabedatenquelle gelesen werden sollen. Diese Option ist für Testzwecke und Testläufe hilfreich. Lassen Sie dieses Feld leer, wenn Sie alle Datensätze lesen möchten.
2. Dateiformat: Teradata Bulk-Loader-Format.
3. Kennwörter: Wählen Sie im Auswahlmenü aus, wie Kennwörter im Konfigurationsfenster angezeigt werden. Zur Auswahl stehen:
  - Ausblenden (Standard)
  - Für Rechner verschlüsseln
  - Für Benutzer verschlüsseln
4. Tabelle oder Abfrage: Geben Sie den Namen der Zieltabelle an, aus der Datensätze gelesen werden. Klicken Sie auf
  , damit eine Liste der Tabellen angezeigt wird.
5. Ohne Spool lesen: Teradata-Einstellung. Legt fest, ob beim Ausführen des aktuellen Exportauftrags ein Spool verwendet wird.
6. Fortschrittsbalken nicht anzeigen: Wenn diese Option aktiviert ist, zeigt Alteryx den Status des Lesevorgangs der Datei nicht an, was die Lesezeit verkürzt.
7. SQL-Anweisung vor Erstellen: SQL-Anweisung, die über OleDB ausgeführt wird, BEVOR die Ausgabetabelle gelesen wird. Erweiterte SQL-Kenntnisse erforderlich.
8. SQL-Anweisung nach Erstellen: SQL-Anweisung, die über OleDB ausgeführt wird, NACHDEM die Ausgabetabelle gelesen wurde. Erweiterte SQL-Kenntnisse erforderlich.
9. Tabellen-/Feldnamenstil: Zur Auswahl stehen „In Anführungszeichen“ und „Keiner“. Mit „In Anführungszeichen“ wird für den Datenbanktyp ein Bezeichner in Anführungszeichen gesucht.

Modus ohne Spooling

Legt fest, ob beim Ausführen des aktuellen Exportauftrags Spooling verwendet wird.

Gültige Werte

„Spool“ = Spooling verwenden. Dies ist die Standardeinstellung.
„NoSpool“ = Kein Spooling verwenden. Dieser Wert ist nur dann gültig, wenn das Datenbanksystem „NoSpool“ unterstützt. Wenn das Datenbanksystem „NoSpool“ nicht unterstützt, wird stattdessen „Spool“ verwendet.
„NoSpoolOnly“ = In keinem Fall Spooling verwenden. Wenn das Datenbanksystem „NoSpool“ nicht unterstützt, wird der Auftrag mit einem Fehler beendet.

Spooling-Optionen

Im Modus „NoSpool“ werden die Inhalte einer Tabelle so schnell wie möglich exportiert, ohne dass die Tabelle in eine Spooldatei eingelesen oder die Datei vor dem Extrahieren an alle AMP verteilt wird.

(Standard) SPOOL der Daten.
Verwendung des Modus NOSPOOLONLY, aber Rückgabe eines Fehlers, wenn NOSPOOL nicht unterstützt wird.
Verwendung des Modus NOSPOOL, wenn möglich. Andernfalls Spooling der Daten in der Teradata-Datenbank.

Einschränkungen und Funktionalität

Der Modus NOSPOOL gilt nur für einfache SELECT-Anweisungen. Folgende Anweisungen werden nicht unterstützt:
Zugriff auf Nichtdatentabellen, wie SELECT DATE oder SELECT USER
Modifizierer USING; definieren Sie stattdessen Einschränkungsparameter, indem Sie einen FastExport IMPORT-Befehl mit zusätzlichen FIELD- und FILLER-Befehlen verwenden.
Enthält eine SORT- (ORDER BY), HAVING- oder WITH-Klausel
Verknüpft
Aggregationen (Erläuterung zeigt den SUM-Schritt)
TABLE-Funktionen
OLAP-Funktionen (Online Analytical Processing)
Mehrere SELECT-Anweisungen oder Anforderungen mit mehreren Anweisungen
Anweisungen mit 0 oder mehr als einem Abruf- oder Samplingschritt
Der NOSPOOL-Modus ruft Daten nur aus einer Tabelle ab, die SELECT-Anweisung kann jedoch einschränken, welche Spalten exportiert werden, und kann den Auftrag auf eine Teilmenge der Zeilen beschränken.
Skalarausdrücke/-funktionen sind zulässig.
Die Einschränkungen für die Sample- und Partition-Beseitigung werden unterstützt.
Die für einen regulär gespoolten Auftrag zurückgegebene Aktivitätsanzahl zeigt die Anzahl der betroffenen Blöcke an; für nicht gespoolte Aufträge ist die Anzahl der Blöcke jedoch unbekannt, daher enthält die Antwortmeldung „ActivityType“ (anstelle von „Activity_Count“), um den NOSPOOL-Prozess anzuzeigen.

Nachteile des NOSPOOL-Modus

Sperren bleiben während des gesamten Exportprozesses erhalten.
Zuvor während der Spoolingphase erkannte Datenkonvertierungsfehler werden erst erkannt, wenn der Block gelesen wird, was während des Exports jederzeit passieren kann.
Die Zeilenreihenfolge muss zwischen Ausführungen (wegen der fehlenden ORDER BY-Klausel) nicht konsistent sein. Der NOSPOOL-Modus bietet daher keine Garantie für Konsistenz.

Weitere Informationen zum SPOOL-/NOSPOOL-Modus finden Sie in der Referenz zu Teradata FastExport.