Amazon Redshift

Verbindungstyp

ODBC (64 Bit)

Typ der Unterstützung

Lesen und Schreiben; In-DB

Validiert am

Datenbankversion: 1.0.35649

ODBC-Clientversion: 1.5.2.1002

Weitere Informationen zum Simba Athena ODBC-Treiber finden Sie in der Dokumentation von Simba ODBC.

Anmerkung

Um Fehler beim Speichern Ihres Workflows auf dem Server zu vermeiden, setzen Sie das Häkchen bei Encrypt Password For: All Users of This Machine unter Simba Amazon Redshift ODBC Driver DSN Setup.

Alteryx-Tools für die Verbindung

Standard-Workflow-Verarbeitung

Eingabedaten-ToolInput Data Tool

Datenausgabe-ToolOutput Data Tool

In-DB-Workflow-Verarbeitung

In-DB-verbinden-Tool

Blue icon with database being plugged in.

Eingehender-Datenstrom-Tool

Blue icon with a stream-like object flowing into a database.

Azure-AD-Authentifizierung

Alteryx ermöglicht die Authentifizierung auf Unternehmensebene für Redshift, sodass Sie Identitäten aus Azure Active Directory nutzen können, um in Redshift auf Daten zuzugreifen.

Voraussetzungen:

Sicherheitsintegration zwischen Azure Active Directory und Amazon Redshift.
Azure-AD-Benutzer hat Zugriff auf die AWS-Redshift-Instanz bereitgestellt.

Weitere Informationen zur Integration von Azure AD mit Redshift finden Sie in den Community-Artikeln.

ODBC-Verbindung konfigurieren

Im ODBC-Datenquellen-Administrator:

Wählen Sie den Redshift-Treiber aus, und wählen Sie Konfigurieren aus.
Geben Sie Ihre Verbindungseinstellungen und Anmeldedaten ein.
Wählen Sie im Bereich ZusätzlicheOptionen die Option Vollständige Ergebnisse in den Speicher abrufen aus.
Anmerkung
Diese Einstellung würde das gesamte Dataset in den physischen Speicher laden. Wenn der physische Speicher knapp wird, kann sich diese Einstellung auf Grundlage von Datenvolumen und verfügbarem physischen Speicher ändern, und Sie müssen möglicherweise Ihren DBA für eine empfohlene Einstellung einbeziehen.
Wählen Sie OK, um die Verbindung zu speichern.

Konfiguration einer Amazon Redshift Bulk-Verbindung

So verwenden Sie die Bulk-Verbindung über das Ausgabedaten-Tool:

Wählen Sie das Auswahlmenü In Datei oder Datenbank schreiben aus und wählen Sie Andere Datenbanken > Amazon Redshift Bulk aus.
Wählen Sie einen Datenquellennamen aus (oder wählen Sie ODBC-Administrator, um einen zu erstellen). Siehe ODBC- und OLEDB-Datenbankverbindungen.
(Optional) Geben Sie einen Benutzernamen und ein Kennwort ein.
Geben Sie im Abschnitt AmazonS3 Ihren AWS-Zugangsschlüssel und Geheimen AWS-Schlüssel ein, um auf die Daten für den Upload zuzugreifen.
Wählen Sie im Dropdown Verschlüsselung mit geheimem Schlüssel eine Verschlüsselungsoption aus:
- Ausblenden: Blendet das Passwort mit minimaler Verschlüsselung aus.
- Für Rechner verschlüsseln: Jeder Benutzer des Rechners kann die Verbindung vollständig nutzen.
- Für Benutzer verschlüsseln: Der angemeldete Benutzer kann die Verbindung auf einem beliebigen Computer nutzen.
Wählen Sie im Auswahlmenü Endpunkt die Option Standard aus, damit Amazon den Endpunkt automatisch und auf Grundlage des von Ihnen ausgewählten Bucket bestimmen kann. Um einen Endpunkt für private S3-Bereitstellungen festzulegen oder wenn Sie einen bestimmten Bereich kennen, können Sie abwechselnd einen Endpunkt (S3-Bereich) auswählen, einen benutzerdefinierten Endpunkt eingeben oder einen von zehn zuvor eingegebenen benutzerdefinierten Endpunkten auswählen.
Wenn der von Ihnen ausgewählte Bereich nicht in der Region des von Ihnen angegebenen Endpunkts liegt, tritt dieser Fehler auf: „Der Bucket, auf den Sie zugreifen möchten, muss über den angegebenen Endpunkt adressiert werden. Senden Sie alle künftigen Anfragen an diesen Endpunkt.“ Wählen Sie Standard aus, um den Fehler zu löschen.
(Optional) Wählen Sie Signatur V4 für Authentifizierung verwenden aus, um anstelle der standardmäßigen Signaturversion 2 die Signaturversion 4 zu verwenden. Dies erhöht die Sicherheit, aber die Verbindungsgeschwindigkeit könnte langsamer sein. Diese Option ist für Regionen, in denen die Signaturversion 4 erforderlich ist, automatisch aktiviert.
Regionen, die Signaturversion 4 benötigen: Regionen, die nach dem 30. Januar 2014 erstellt wurden, unterstützen nur Signaturversion 4. Diese Regionen erfordern eine Authentifizierung nach Signaturversion 4:
- USA-Ost (Ohio)
- Kanada (zentral)
- Asien/Pazifik (Mumbai)
- Asien/Pazifik (Seoul)
- Europe (Frankfurt)
- Europa (London)
- China (Peking)
Wählen Sie eine Methode zur serverseitigenVerschlüsselung zum Hochladen in einen verschlüsselten Amazon S3-Bucket aus. Weitere Informationen zu Amazon S3-Verschlüsselungsmethoden finden Sie im Entwicklerleitfaden für den Amazon Simple Storage Service.
- Keine (Standard): Es wird keine Verschlüsselungsmethode verwendet.
- SSE-KMS: Verwenden Sie serverseitige Verschlüsselung mit von AWS KMS verwalteten Schlüsseln. Optional können Sie eine KMS-Schlüssel-ID angeben. Wenn Sie diese Methode auswählen, ist die Option Signatur V4 für Authentifizierung verwenden standardmäßig aktiviert.
Geben Sie in unter Bucket-Name den Namen des AWS-Buckets ein, in dem Ihre Datenobjekte gespeichert sind.

Optional können Sie Redshift Spectrum verwenden, um eine Verbindung zu Spectrum-Tabellen herzustellen.

Feldzuordnung

Beim Massenladen von Daten in Amazon Redshift werden die Daten in falsche Felder geschrieben, wenn deren Reihenfolge in der Workflow-Ausgabe und in der Redshift-Datenbank voneinander abweichen. Umgehungslösung:

Wählen Sie die Option Feldzuordnung anhängen im Datenausgabe-Tool aus, um sie zu konfigurieren, auch wenn Sie die Standardeinstellung nicht ändern. In der Workflow-XML des Datenausgabe-Tools wird dadurch das Tag <AppendMapping mode="ByName" /> ausgefüllt.
Ändern Sie die Ausgabeoption in Tabelle überschreiben (Verwerfen).

Ausgabeoptionen konfigurieren

Optional können Sie die folgenden Redshift-Optionen angeben oder anpassen. Weitere Informationen finden Sie im Entwicklerleitfaden für Amazon Redshift-Datenbanken.

Anmerkung

Spezifizieren Sie sowohl den Schema- als auch den Tabellennamen zum Erstellen von Spectrum-Tabellen mit dem Datenausgabe-Tool.

spectrum_schema.tablename

Der Verteilungsschlüssel wird ignoriert, wenn für die Verteilungsart nicht „Schlüssel" ausgewählt ist. Wenn Sie für die Sortierart „Kein“ auswählen, wird der Sortierschlüssel ignoriert.

Primärschlüssel: Wählen Sie Spalten für den Primärschlüssel aus, und passen Sie die Reihenfolge der Spalten an.
Verteilungsart: Wählen Sie Gleichmäßig, Schlüssel oder Alle aus.
Verteilungsschlüssel: Wählen Sie eine Spalte für den Verteilungsschlüssel aus.
Sortierstil: Wählen Sie Keinen, Zusammengesetzt oder Überlappend.
Sortierschlüssel: Wählen Sie die Spalten für den Sortierschlüssel aus und passen Sie die Reihenfolge der Spalten an.
Vakuum- und Analysevorgänge aktivieren: (Nur Bulk-Verbindungen) Standardmäßig aktiviert. Bei entsprechender Aktivierung werden die Wartungsbefehle VACUUM und ANALYZE ausgeführt, nachdem ein Bulk-Load-Befehl APPEND für die Redshift-Datenbank ausgeführt wurde.
Größe von Bulk-Load-Einheiten (1 MB bis 102400 MB): Zur Steigerung der Hochlade-Leistung werden große Dateien in kleinere Dateien mit Ganzzahl-Größenangabe in Megabyte aufgeteilt. Der Standardwert ist 128.
Umgekehrter Schrägstrich (\)als Escape-Zeichen aktivieren: (Nur Bulk-Verbindungen) Standardmäßig aktiviert. Wenn diese Option aktiviert ist, werden Zeichen, die unmittelbar auf einen umgekehrten Schrägstrich folgen, als Spaltendaten geladen, selbst wenn die Zeichen normalerweise für einen speziellen Zweck verwendet werden (z.B. Trennzeichen, Anführungszeichen, eingebetteter Zeilenumbruch oder Escape-Zeichen).

Wichtig

Kennungen werden in der Datenbank in Kleinbuchstaben umgewandelt. In Abfrageergebnissen werden Tabellen- und Spaltennamen standardmäßig in Kleinbuchstaben zurückgegeben. Weitere Informationen finden Sie in der Dokumentation zu Amazon-Namen und -Kennungen.

Bekannte Probleme

Beim Einfügen eines Datensatzes in eine Amazon Redshift-Tabelle mit einer Spalte, die ein Attribut IDENTITY(seed, step) enthält, ist der Wert der ersten einzufügenden Spalte Null, und nicht der Wert, der an das Datenausgabe-Tool übergeben wird.
Redshift-Server unterstützt nicht die Ausführung mehrerer Abfragen in einer einzelnen vorbereiteten Anweisung.