Amazon Redshift
Verbindungstyp | ODBC (64 Bit) |
Typ der Unterstützung | Lesen und Schreiben; In-DB |
Validiert am | Datenbankversion: 1.0.35649 ODBC-Clientversion: 1.5.2.1002 |
Weitere Informationen zum Simba Athena ODBC-Treiber finden Sie in der Dokumentation von Simba ODBC .
Anmerkung
Um Fehler beim Speichern Ihres Workflows auf dem Server zu vermeiden, setzen Sie das Häkchen bei Encrypt Password For: All Users of This Machine unter Simba Amazon Redshift ODBC Driver DSN Setup .
Alteryx-Tools für die Verbindung
Standard-Workflow-Verarbeitung
In-DB-Workflow-Verarbeitung
Azure-AD-Authentifizierung
Alteryx ermöglicht die Authentifizierung auf Unternehmensebene für Redshift, sodass Sie Identitäten aus Azure Active Directory nutzen können, um in Redshift auf Daten zuzugreifen.
Voraussetzungen:
Sicherheitsintegration zwischen Azure Active Directory und Amazon Redshift.
Azure-AD-Benutzer hat Zugriff auf die AWS-Redshift-Instanz bereitgestellt.
Weitere Informationen zur Integration von Azure AD mit Redshift finden Sie in den Community-Artikeln.
ODBC-Verbindung konfigurieren
Im ODBC-Datenquellen-Administrator:
Wählen Sie den Redshift-Treiber aus, und wählen Sie Konfigurieren aus.
Geben Sie Ihre Verbindungs einstellungen und Anmeldedaten ein.
Wählen Sie im Bereich Zusätzliche Optionen die Option Vollständige Ergebnisse in den Speicher abrufen aus.
Anmerkung
Diese Einstellung würde das gesamte Dataset in den physischen Speicher laden. Wenn der physische Speicher knapp wird, kann sich diese Einstellung auf Grundlage von Datenvolumen und verfügbarem physischen Speicher ändern, und Sie müssen möglicherweise Ihren DBA für eine empfohlene Einstellung einbeziehen.
Wählen Sie OK , um die Verbindung zu speichern.
Konfiguration einer Amazon Redshift Bulk-Verbindung
So verwenden Sie die Bulk-Verbindung über das Ausgabedaten-Tool:
Wählen Sie das Dropdown-Menü In Datei oder Datenbank schreiben aus und wählen Sie Andere Datenbanken > Amazon Redshift Bulk aus.
Wählen Sie einen Datenquellennamen aus (oder wählen Sie ODBC-Administrator , um einen zu erstellen). Siehe ODBC- und OLEDB-Datenbankverbindungen.
(Optional) Geben Sie einen Benutzernamen und ein Kennwort ein.
Geben Sie im Abschnitt Amazon S3 Ihren AWS-Zugangsschlüssel und Geheimen AWS-Schlüssel ein, um auf die Daten für den Upload zuzugreifen.
Wählen Sie im Dropdown Verschlüsselung mit geheimem Schlüssel eine Verschlüsselungsoption aus:
Ausblenden: Blendet das Passwort mit minimaler Verschlüsselung aus.
Für Rechner verschlüsseln : Jeder Benutzer des Rechners kann die Verbindung vollständig nutzen.
Für Benutzer verschlüsseln : Der angemeldete Benutzer kann die Verbindung auf einem beliebigen Computer nutzen.
Wählen Sie im Dropdown-Menü Endpunkt die Option Standard aus, damit Amazon den Endpunkt automatisch und auf Grundlage des von Ihnen ausgewählten Bucket bestimmen kann. Um einen Endpunkt für private S3-Bereitstellungen festzulegen oder wenn Sie einen bestimmten Bereich kennen, können Sie abwechselnd einen Endpunkt (S3-Bereich) auswählen, einen benutzerdefinierten Endpunkt eingeben oder einen von zehn zuvor eingegebenen benutzerdefinierten Endpunkten auswählen.
Wenn der von Ihnen ausgewählte Bereich nicht in der Region des von Ihnen angegebenen Endpunkts liegt, tritt dieser Fehler auf: „Der Bucket, auf den Sie zugreifen möchten, muss über den angegebenen Endpunkt adressiert werden. Senden Sie alle künftigen Anfragen an diesen Endpunkt.“ Wählen Sie Standard aus, um den Fehler zu löschen.
(Optional) Wählen Sie Signatur V4 für Authentifizierung verwenden aus, um anstelle der standardmäßigen Signaturversion 2 die Signaturversion 4 zu verwenden. Dies erhöht die Sicherheit, aber die Verbindungsgeschwindigkeit könnte langsamer sein. Diese Option ist für Regionen, in denen die Signaturversion 4 erforderlich ist, automatisch aktiviert.
Regionen, die Signaturversion 4 benötigen : Regionen, die nach dem 30. Januar 2014 erstellt wurden, unterstützen nur Signaturversion 4. Diese Regionen erfordern eine Authentifizierung nach Signaturversion 4:
USA-Ost (Ohio)
Kanada (zentral)
Asien/Pazifik (Mumbai)
Asien/Pazifik (Seoul)
Europe (Frankfurt)
Europa (London)
China (Peking)
Wählen Sie eine Methode zur serverseitigen Verschlüsselung zum Hochladen in einen verschlüsselten Amazon S3-Bucket aus. Weitere Informationen zu Amazon S3-Verschlüsselungsmethoden finden Sie im Entwicklerleitfaden für den Amazon Simple Storage Service .
Keine (Standard) : Es wird keine Verschlüsselungsmethode verwendet.
SSE-KMS : Verwenden Sie serverseitige Verschlüsselung mit von AWS KMS verwalteten Schlüsseln. Optional können Sie eine KMS - Schlüssel - ID angeben. Wenn Sie diese Methode auswählen, ist die Option Signatur V4 für Authentifizierung verwenden standardmäßig aktiviert.
Geben Sie in unter Bucket-Name den Namen des AWS-Buckets ein, in dem Ihre Datenobjekte gespeichert sind.
Optional können Sie Redshift Spectrum verwenden , um eine Verbindung zu Spectrum-Tabellen herzustellen.
Feldzuordnung
Beim Massenladen von Daten in Amazon Redshift werden die Daten in falsche Felder geschrieben, wenn deren Reihenfolge in der Workflow-Ausgabe und in der Redshift-Datenbank voneinander abweichen. Umgehungslösung:
Wählen Sie die Option Feldzuordnung anhängen im Datenausgabe-Tool aus, um sie zu konfigurieren, auch wenn Sie die Standardeinstellung nicht ändern. In der Workflow-XML des Datenausgabe-Tools wird dadurch das Tag <AppendMapping mode="ByName" /> ausgefüllt.
Ändern Sie die Ausgabeoption in Tabelle überschreiben (Verwerfen) .
Ausgabeoptionen konfigurieren
Optional können Sie die folgenden Redshift-Optionen angeben oder anpassen. Weitere Informationen finden Sie im Entwicklerleitfaden für Amazon Redshift-Datenbanken .
Anmerkung
Spezifizieren Sie sowohl den Schema- als auch den Tabellennamen zum Erstellen von Spectrum-Tabellen mit dem Datenausgabe-Tool.
spectrum_schema.tablename
Der Verteilungsschlüssel wird ignoriert, wenn für die Verteilungsart nicht „Schlüssel" ausgewählt ist. Wenn Sie für die Sortierart „Kein“ auswählen, wird der Sortierschlüssel ignoriert.
Primär schlüssel : Wählen Sie Spalten für den Primärschlüssel aus, und passen Sie die Reihenfolge der Spalten an.
Verteilungs art : Wählen Sie Gleichmäßig , Schlüssel oder Alle aus.
Verteilungs schlüssel : Wählen Sie eine Spalte für den Verteilungsschlüssel aus.
Sortier stil : Wählen Sie Keinen , Zusammengesetzt oder Überlappend .
Sortier schlüssel : Wählen Sie die Spalten für den Sortierschlüssel aus und passen Sie die Reihenfolge der Spalten an.
Vakuum- und Analysevorgänge aktivieren : (Nur Bulk-Verbindungen) Standardmäßig aktiviert. Bei entsprechender Aktivierung werden die Wartungsbefehle VACUUM und ANALYZE ausgeführt, nachdem ein Bulk-Load-Befehl APPEND für die Redshift-Datenbank ausgeführt wurde.
Größe von Bulk-Load-Einheiten (1 MB bis 102400 MB) : Zur Steigerung der Hochlade-Leistung werden große Dateien in kleinere Dateien mit Ganzzahl-Größenangabe in Megabyte aufgeteilt. Der Standardwert ist 128.
Umgekehrter Schrägstrich (\)als Escape-Zeichen aktivieren : (Nur Bulk-Verbindungen) Standardmäßig aktiviert. Wenn diese Option aktiviert ist, werden Zeichen, die unmittelbar auf einen umgekehrten Schrägstrich folgen, als Spaltendaten geladen, selbst wenn die Zeichen normalerweise für einen speziellen Zweck verwendet werden (z.B. Trennzeichen, Anführungszeichen, eingebetteter Zeilenumbruch oder Escape-Zeichen).
Wichtig
Kennungen werden in der Datenbank in Kleinbuchstaben umgewandelt. In Abfrageergebnissen werden Tabellen- und Spaltennamen standardmäßig in Kleinbuchstaben zurückgegeben. Weitere Informationen finden Sie in der Dokumentation zu Amazon-Namen und -Kennungen .
Bekannte Probleme
Beim Einfügen eines Datensatzes in eine Amazon Redshift-Tabelle mit einer Spalte, die ein Attribut IDENTITY(seed, step) enthält, ist der Wert der ersten einzufügenden Spalte Null, und nicht der Wert, der an das Datenausgabe-Tool übergeben wird.