Skip to main content

Snowflake

Anforderungen an die Treiberkonfiguration

Für den In-DB-Prozess und um Fehler beim Schreiben von Daten mit dem Datenausgabe-Tool zu vermeiden, müssen Sie ein Warehouse, ein Schema und eine Datenbank im Treiber angeben.

Typ der Unterstützung

Lesen und Schreiben; In-DB

Validiert am

Datenbankversion: 6.8.1

ODBC-Client-Version: 3.0.0.1001 64 Bit

Alteryx-Tools für die Verbindung

  • Datenausgabe-Tool (Standard-Workflow-Verarbeitung)

  • Tool „In-DB verbinden“ und Tool „Eingehender Datenstrom“ (In-Database-Workflow-Verarbeitung).

In-DB-Workflow-Verarbeitung

In-DB-verbinden-Tool

Blue icon with database being plugged in.

Link

Eingehender-Datenstrom-Tool

Blue icon with a stream-like object flowing into a database.

Link

Eingabedaten-Tool

  1. Wählen Sie das Eingabedaten-Tool aus, und navigieren Sie zum Bereich Eingabedaten (1) – Konfiguration > Wählen Sie das Dropdown-Symbol unter Datei oder Datenbank verbinden aus.

  2. Navigieren Sie im Fenster Datenverbindungen zu > Alle Datenquellen  > Snowflake  > ODBC .

  3. Geben Sie im Popup-Fenster Snowflake ODBC-Verbindung Ihren Benutzernamen und Ihr Kennwort ein.

  4. Navigieren Sie im Fenster Tabelle auswählen oder Abfrage eingeben zur Tabellen -Registerkarte > Wählen Sie eine Tabelle aus > Wählen Sie OK aus.

Klassischer Modus

Wenn Sie im Klassischen Modus arbeiten möchten, navigieren Sie zu Optionen  > Benutzereinstellungen  > Benutzereinstellungen bearbeiten > Aktivieren Sie das Kontrollkästchen Klassischen Modus für Menüoptionen der Eingabe-/Ausgabe-Tools verwenden .

  1. Um eine Abfrage einzugeben, wählen Sie die Registerkarte SQL-Editor aus > Geben Sie die Abfrage in den vorhandenen Bereich ein > Wählen Sie die Schaltfläche Testabfrage aus > Wählen Sie OK aus.

  2. Wählen Sie das Datenausgabe-Tool aus, und navigieren Sie zu Menü  > Optionen .

  3. Wählen Sie Benutzereinstellungen  > Benutzereinstellungen bearbeiten  > Aktivieren Sie das Kontrollkästchen Klassischen Modus für Menüoptionen der Eingabe-/Ausgabe-Tools verwenden .

  4. Navigieren Sie zum Bereich Ausgabedaten (1) – Konfiguration  > Wählen Sie unter In Datei oder Datenbank schreiben  > das Dropdown-Symbol aus.

  5. Wählen Sie Andere Datenbanken  > und Snowflake Bulk... aus.

  6. Sie können auch das Eingabedaten-Tool (Klassischer Modus) verwenden, um Ihre Dateien und Datenquellen auszuwählen.

Wenn Sie in den klassischen Modus wechseln möchten, ersetzen Sie Ihr Datenausgabe-Tool mit einem neuen Tool > Wählen Sie den Canvas aus, oder drücken Sie F5 zum Aktualisieren.

Datenausgabe-Tool

Damit das Lesen und Schreiben von Tabellen und Spalten vollständig unterstützt wird, setzen Sie die Alteryx Designer-Option Tabellen-/Feldname im SQL-Stil auf in Anführungszeichen . Mit „in Anführungszeichen“ wird gezielt die Tabelle in der Datenbank ausgewählt, während bei der Auswahl von Kein(e) die Ergebnisse in Großbuchstaben angezeigt werden.

Beachten Sie die folgenden Hinweise, bevor Sie eine Snowflake Bulk-Verbindung konfigurieren:

  • Daten können nur mit dem Snowflake Bulk Loader geschrieben werden.

  • Nach dem Schreiben der Daten in die neue Ausgabe entfernt Snowflake Bulk Loader die geschriebenen Daten aus dem S3-Bucket.

  • Die maximal zulässige Länge für Textfelder beträgt 16.777.216 Byte.

Weitere Informationen finden Sie in der Snowflake-Dokumentation .

Anmerkung

Ab Version 2023 bricht Designer alle nicht abgeschlossenen In-DB-Ausführungen ab, wenn der Workflow lokal abgebrochen wird. Auf diese Weise können Sie die Sperre Ihrer Daten-Pipelines aufheben. Die Funktion verbessert die Datenbankinteraktion insgesamt.

ODBC-Verbindung konfigurieren

  1. Wählen Sie im ODBC-Datenquellen-Administrator den Snowflake-Treiber aus, und wählen Sie Konfigurieren aus.

  2. Geben Sie Ihre Verbindungseinstellungen und Anmeldedaten ein.

  3. Wählen Sie OK aus, um die Verbindung zu speichern.

Anmerkung

Damit das Lesen und Schreiben von Camel-Case-Tabellen und -Spalten vollständig unterstützt wird, müssen Sie die Alteryx Designer-Option Tabellen-/Feldname im SQL-Stil auf in Anführungszeichen setzen.

Snowflake-JWT für die Schlüsselpaar-Authentifizierung

Mit Version 2024.1 ist die Verwendung der Schlüsseldateiauthentifizierung (JWT) für Snowflake in Alteryx Designer mit dem DCM einfacher denn je. Wählen Sie einfach Ihre Snowflake-Verbindung aus, und suchen Sie die Schlüsselpaar-Authentifizierung in der Liste der verfügbaren Datenquellen.

So konfigurieren Sie Snowflake-JWT über den ODBC-Treiber:

  1. Erstellen Sie das Token gemäß den Anweisungen aus Snowflake: https://docs.snowflake.com/en/user-guide/key-pair-auth.html.

  2. Setzen Sie den Authentifikator im ODBC-DSN auf SNOWFLAKE_JWT.

    Snowflake JWT
  3. In Alteryx muss die Verbindungszeichenfolge auf den Dateispeicherort weisen, z. B.: odbc:DSN=Simba_Snowflake_JWT;UID=user;PRIV_KEY_FILE=G:\AlteryxDataConnectorsTeam\OAuth project\PEMkey\rsa_key.p8;PRIV_KEY_FILE_PWD=__EncPwd1__;JWT_TIMEOUT=120

    Weitere Anweisungen finden Sie in der Snowflake-Dokumentation .

Weitere Informationen zum Konfigurieren der Snowflake JWT-Authentifizierung für Ihr Snowflake-Konto finden Sie in der Snowflake-Dokumentation .

Einrichten einer Snowflake Bulk-Verbindung zum Schreiben von Daten

Bulk Loading wird sowohl für Verbindungen mit DSN als auch für DSN-lose Verbindungen unterstützt.

Um den Bulk-Loader mit einer DSN-losen Verbindungszeichenfolge zu konfigurieren, erstellen Sie die Verbindungszeichenfolge manuell. Die Zeichenfolge muss Parameter enthalten, die für das Schreiben in Snowflake und für das Staging erforderlich sind. Die für Snowflake benötigten sind in der Snowflake-Dokumentation zu finden. Die für das Staging erforderlichen Informationen finden Sie unten.

  • Beispiel für eine Verbindungszeichenfolge: snowbl:Driver= {SnowflakeDSIIDriver};Server=customerinstance.snowflakecomputing.com;Database=TEST_DB; Warehouse=TEST_WAREHOUSE;schema=PUBLIC;UID=user;PWD=password;Bucket=S3Bucket; Access=IAMAccessKey;Secret=IAMSecretKey;URL=s3.amazonaws.com;Region=us-east-1

Um den Bulk-Loader mit einem DSN zu konfigurieren, verwenden Sie die Benutzeroberfläche, und führen Sie die folgenden Schritte aus:

  1. Wählen Sie das Datenausgabe-Tool aus, und navigieren Sie zum Bereich Datenausgabe (1) – Konfiguration .

  2. Wählen Sie unter In Datei oder Datenbank schreiben das Dropdown-Symbol aus > Navigieren Sie zum Fenster Datenverbindungen , und wählen Sie die Registerkarte Datenquellen  > Alle Datenquellen  > Snowflake aus > Wählen Sie Bulk aus.

  3. Wählen Sie im Fenster Snowflake Bulk-Verbindung die Registerkarte Lokal aus > Geben Sie Ihre Anmeldedaten in den Flächen für Benutzername (optional) und Kennwort (optional) ein > Wählen Sie OK , um das Popup-Fenster Ausgabetabelle anzuzeigen.

  4. Geben Sie den Namen der Tabelle (oder des Arbeitsblatts) für die angegebene Ausgabedatei ein, entweder mit dem Tabellennamen oder in Form von db.schema.tablename . Dies ist Ihre voll qualifizierte Tabelle.

  5. Wählen Sie unter Optionen im Bereich Ausgabedaten (1) – Konfiguration aus dem Dropdown-Menü Tabellen-/Feldname im SQL-Stil entweder in Anführungszeichen oder Kein(e) aus.

  6. Bestimmen Sie unter Datei-/Tabellennamen aus Feld entnehmen , ob Sie das Kontrollkästchen für das Dropdown-Menü Suffix an Datei-/Tabellenname anhängen aktivieren möchten. Wenn Sie das Kontrollkästchen aktivieren, wählen Sie in der Dropdown-Auswahl die Option ...

    1. Suffix an Datei-/Tabellenname anhängen

    2. Präfix dem Datei-/Tabellennamen voranstellen

    3. Datei-/Tabellenname ändern.

    4. Gesamten Dateipfad ändern

  7. Wenn Sie das Kontrollkästchen Suffix an Datei-/Tabellennamen anhängen aktivieren, wählen Sie unter Feld enthält Dateiname oder Teil des Dateinamens eine der folgenden Optionen aus:

    1. SEQUENCE_CATALOG

    2. SEQUENCE_SCHEMA

    3. SEQUENCE_NAME

    4. SEQUENCE_OWNER

    5. DATA_TYPE

    6. NUMERIC_PRECISION

    7. NUMERIC_PRECISION_RADIX

    8. NUMERIC_SCALE

    9. START_VALUE

    10. MINIMUM_VALUE

    11. MAXIMUM_VALUE

    12. NEXT_VALUE

    13. INCREMENT

    14. CYCLE_OPTION

    15. CREATED

    16. LAST_ALTERED

    17. KOMMENTAR

  8. Entscheiden Sie, ob Sie das Kontrollkästchen Feld in Ausgabe behalten für die Option aktivieren möchten, die Sie aus dem Dropdown-Menü zur Verwendung mit den Daten Ihrer Tabelle ausgewählt haben.

Methoden zur Bereitstellung von Daten mit Snowflake Bulk-Verbindung

Snowflake Bulk-Verbindung zum Schreiben auf Amazon S3 konfigurieren

  1. Wählen Sie im Fenster Ausgabedaten – Konfiguration In Datei oder Datenbank schreiben aus, und wählen Sie Andere Datenbanken > Snowflake Bulk , um das Fenster Snowflake Bulk-Verbindung anzuzeigen.

  2. Wählen Sie einen Datenquellennamen aus, oder wählen Sie ODBC-Administrator , um einen zu erstellen. Siehe ODBC- und OLEDB-Datenbankverbindungen.

  3. Geben Sie bei Bedarf Benutzernamen und Kennwort ein.

  4. Geben Sie in Amazon S3 Ihren AWS-Zugangsschlüssel und Ihren Geheimen AWS-Schlüssel ein.

  5. Wählen Sie unter Verschlüsselung mit geheimem Schlüssel eine Verschlüsselungsoption aus:

    • Ausblenden : Blendet das Kennwort mit minimaler Verschlüsselung aus.

    • Für Rechner verschlüsseln : Jeder Benutzer des Rechners kann die Verbindung vollständig nutzen.

    • Für Benutzer verschlüsseln : Der angemeldete Benutzer hat vollen Zugang zu der Verbindung auf einem beliebigen Computer.

  6. Wählen Sie unter Endpunkt eine der folgenden Optionen aus:

    • Standard : Amazon bestimmt den Endpunkt auf Grundlage des ausgewählten Buckets.

    • Spezifischer Endpunkt : Geben Sie einen benutzerdefinierten Endpunkt an oder wählen Sie zwischen zuvor eingegebenen Endpunkten aus, um eine S3-Region anzugeben, in der sich der Bucket befindet.

      • Der S3-Bucket muss sich in der angegebenen S3-Region befinden. Andernfalls wird die folgende Fehlermeldung angezeigt: Der Bucket, auf den Sie zugreifen möchten, muss über den spezifizierten Endpunkt aufgerufen werden . Senden Sie alle künftigen Anfragen an diesen Endpunkt.

      • Wählen Sie Standard , um die Fehlermeldung zu schließen.

  7. (Optional) Wählen Sie Signature V4 für Authentifizierung verwenden aus, um die Sicherheit über die standardmäßige Signaturversion 2 hinaus zu erhöhen. Diese Option ist für Regionen, in denen die Signaturversion 4 erforderlich ist, automatisch aktiviert. Nach dem 30. Januar 2014 erstellte Regionen unterstützen nur die Signaturversion 4. Für die folgenden Regionen ist eine Authentifizierung nach Signaturversion 4 erforderlich:

    • USA-Ost (Ohio)

    • Kanada (zentral)

    • Asien/Pazifik (Mumbai)

    • Asien/Pazifik (Seoul)

    • Europe (Frankfurt)

    • Europa (London)

    • China (Peking)

  8. Wählen Sie eine serverseitige Verschlüsselungsmethode zum Hochladen in einen verschlüsselten Amazon S3-Bucket aus. Siehe Entwicklerleitfaden für den Amazon Simple Storage Service.

    • None (Standard) : Es wird keine Verschlüsselungsmethode verwendet.

    • SSE-KMS : Verwenden Sie serverseitige Verschlüsselung mit von AWS KMS verwalteten Schlüsseln. Sie können auch eine KMS-Schlüssel-ID angeben. Wenn Sie diese Methode auswählen, ist die Option Signatur V4 für Authentifizierung verwenden standardmäßig aktiviert.

  9. Geben Sie Bucket-Name vom AWS-Bucket ein, in dem die Datenobjekte gespeichert sind.

  10. Konfigurieren Sie zusätzliche Dateiformatoptionen im Bereich Ausgabedaten (1) – Konfiguration . Weitere Informationen finden Sie unter Dateiformatoptionen.

Konfigurieren einer Snowflake Bulk-Verbindung zum Schreiben in lokalen Speicher

Sie haben jetzt drei erweiterte Optionen zur Auswahl, wenn Sie Daten auf Ihrem lokalen Laufwerk bereitstellen!

Wählen Sie das Datenausgabe-Tool aus, und navigieren Sie zum Bereich Datenausgabe (1) – Konfiguration > Navigieren Sie unter In Datei oder Datenbank schreiben zum Fenster Datenverbindungen , und wählen Sie die Registerkarte Datenquellen > Alle Datenquellen  > Snowflake  > und Bulk aus. Wählen Sie im Fenster Snowflake Bulk-Verbindung  > die Registerkarte Lokal aus >

  1. Benutzer-Bereitstellung : die interne Bereitstellung durch Snowflake, die dem Benutzer zugeordnet ist.

    1. Wählen Sie Benutzer aus > Wählen Sie OK aus. Geben Sie im Popup-Fenster Ausgabetabelle den Namen der Tabelle (oder des Arbeitsblatts) für das Ausgabedateiformat ein, der entweder mit dem Tabellennamen oder in Form von db.schema.tablename angegeben wurde. Dies ist Ihre voll qualifizierte Tabelle. Wählen Sie OK aus. Wählen Sie unter Optionen im Bereich Ausgabedaten (1) – Konfiguration aus dem Dropdown-Menü Tabellen-/Feldname im SQL-Stil entweder in Anführungszeichen oder Kein(e) aus.

  2. Tabellen-Bereitstellung : interne Bereitstellung durch Snowflake, die der Tabelle zugeordnet ist.

    1. Wählen Sie Tabellen-Bereitstellung aus > Wählen Sie OK aus. Geben Sie im Popup-Fenster Ausgabetabelle den Namen der Tabelle (oder des Arbeitsblatts) für das Ausgabedateiformat ein, der entweder mit dem Tabellennamen oder in Form von db.schema.tablename angegeben wurde. Dies ist Ihre voll qualifizierte Tabelle. Wählen Sie OK aus. Wählen Sie unter Optionen im Bereich Ausgabedaten (1) – Konfiguration aus dem Dropdown-Menü Tabellen-/Feldname im SQL-Stil entweder in Anführungszeichen oder Kein(e) aus.

      1. Interne Namen-Bereitstellung : Erstellen Sie in der Snowflake-Datenbank einen CREATE STAGE-Befehl , und führen Sie ihn aus. Geben Sie außerdem den Bereitstellungsnamen in der Tool-Konfiguration an.

        Anmerkung

        Die maximale Feldgröße beträgt 16 MB. Wenn der Schwellenwert für die Feldgröße überschritten wird, wird ein Fehler ausgegeben, und es werden keine Daten geschrieben.

  3. Komprimierungstyp : Optionen sind entweder „Keine Komprimierung“ oder „Mit GZip komprimieren“.

    1. Keine Komprimierung – Dateien werden als CSV-Datei bereitgestellt und hochgeladen

    2. Mit GZip komprimieren – CSV-Dateien werden mit GZip komprimiert

  4. Blockgröße in MB (1–999) : Mit dieser Option können Sie die Größe jeder lokal bereitgestellten CSV-Datei auswählen.

    Anmerkung

    Die tatsächliche Dateigröße kann aufgrund der unterliegenden Formatierung und Komprimierung von der gewählten Blockgröße abweichen.

  5. Anzahl der Threads (1–99) : Diese Option gibt die Anzahl der Threads an, die zum Hochladen von Dateien auf Snowflake verwendet werden. Bei größeren Dateien kann sich die Leistung verbessern, wenn dieser Wert erhöht wird. Wenn 0 eingegeben wird, wird der Snowflake-Standard verwendet (4).

Ab Stage kann jede Kopie in die Tabelle bis zu 1000 Dateien enthalten. Wenn sich mehr als 1000 Dateien in Stage befinden, werden möglicherweise mehrere Kopie-in-Anweisungen angezeigt. Dies ist eine Snowflake-Anforderung für Kopie-in-Anweisungen unter Verwendung von Dateien. Weitere Informationen finden Sie unter Snowflake-Portal .

Weitere Informationen zu Komprimierungstyp, Blockgröße in MB und Optionen zur Anzahl der Threads finden Sie im Snowflake-Portal .