Skip to main content

Microsoft Azure Data Lake Store

Verbindungstyp

Alteryx-Tool. Die aktuellste Version ist im Alteryx Marketplace verfügbar.

Treiberdetails

Abhängig von der ausgewählten Anmeldemethode muss ein Administrator möglicherweise den Zugriff auf Azure Data Lake und Azure Active Directory konfigurieren, bevor eine Verbindung mit den Alteryx Azure Data Lake-Tools hergestellt werden kann.

Typ der Unterstützung

Lesen und Schreiben

Version

Beschreibung

v2.5.0

  • Kompatibel mit Alteryx Designer und Server 2021.4.2 Patch 6, 2022.1 Patch 4 und höher.

  • Erfordert AMP Engine.

  • Alteryx Server benötigt gespeicherte Anmeldedaten in DCM, um Workflows auszuführen.

  • Option zum lokalen Herunterladen von Dateien für die spätere Verarbeitung hinzugefügt.

  • Unterstützung für Gen1-Authentifizierung entfernt.

  • Probleme im Zusammenhang mit der DCM-Authentifizierung behoben. (TPM-2462, TPM-2176)

  • Probleme behoben, bei denen das ADLS-Eingabe-Tool Nullwerte nicht richtig lesen konnte. (TPM-3098, TPM-2659, TPM-2229)

  • Probleme behoben, bei denen der Workflow nicht ausgeführt werden konnte, wenn die ADLS-Tools so eingestellt waren, dass sie in einer anderen Zeile als 1 mit der Verarbeitung von Daten beginnen. (TPM-2609, TPM-2277)

  • Problem behoben, bei dem das ADLS-Eingabe-Tool andere Daten nach Verarbeitung einer einzelnen Schleife des Blocks ignorierte. (TPM-2781)

  • Problem behoben, bei dem das ADLS-Eingabe-Tool den Fehler „Fehlerhafte CSV-Datei“ zurückgab. (TPM-2175)

  • Problem behoben, bei dem das ADLS-Ausgabe-Tool Datumswerte geändert hat. (TPM-1928)

v2.4.3

  • Kompatibel mit Alteryx Designer und Server 2021.4.2 Patch 4, 2022.1 Patch 2 und höher.

  • Nur mit AMP Engine kompatibel.

  • Unterstützung für DCM hinzugefügt.

    • Für die Ausführung dieses Konnektors in Alteryx Server ist DCM erforderlich.

  • FIPS-fähig.

  • Die SSL-/TLS-Validierung wird jetzt mit dem Windows Certification Store abgeglichen.

  • Verbesserte Schreibleistung und Stabilität.

  • Option hinzugefügt, um Arbeitsspeicherverbrauch und -leistung durch Ändern der variablen Upload-Blockgröße zu optimieren.

  • Problem behoben, bei dem XLSX-Daten abgeschnitten wurden, wenn Zellen mehr als 255 Zeichen enthielten.

  • Problem mit Nicht-Unicode-Zeichen in SSL-Zertifikaten behoben.

  • Problem mit dem ADLS-Ausgabe-Tool, das doppelte Anführungszeichen hinzufügte, obwohl das Feld Anführungszeichen auf Keine gesetzt war, behoben. (TPM-1964)

  • Verbesserungen der Sicherheit.

v2.2.0

  • Ermöglicht Benutzern, in der Ausgabe ein benutzerdefiniertes CSV-Trennzeichen anzugeben.

  • Potenzielle XXE-Schwachstelle behoben.

v2.1.0

  • Neue und verbesserte Benutzeroberfläche.

  • Kleine Probleme behoben.

  • Kompatibel mit Alteryx Designer und Server-Version 2021.2 und neuer.

v2.0

  • UI-Upgrade und verbesserte Fehlerbehandlung

  • Unterstützung für Gen2-Speicher wurde hinzugefügt

  • Unterstützung für Azure Government, China Cloud und benutzerdefinierte Endpunkte wurde hinzugefügt

  • Unterstützung für die Authentifizierung mit gemeinsam verwendetem Schlüssel

  • Unterstützung für öffentliche Anwendungen (eigene und Alteryx)

  • Unterstützung für Multi-Tenancy

  • Unterstützung für Excel-Eingabe und -Ausgabe

  • Möglichkeit, benutzerdefinierte Trennzeichen zum Lesen und Schreiben von CSV-Dateien zu verwenden, wurde hinzugefügt.

  • Kompatibel mit Alteryx Designer und Server-Version 2019.3 und neuer.

v1.1.0

  • Fehler bei der Endbenutzer-Authentifizierung behoben

  • Ermöglicht Benutzern, „URI umleiten“ für die Endbenutzer-Authentifizierung anzugeben

v1.0.2

  • Codepage-Optionen aktualisieren.

  • Es ist möglich, zwischen Codierungen mit derselben Sprache (z. B. „Sprache“ -> „Sprache (spezifischer Code)“) und sortierten Codierungen alphabetisch zu unterscheiden.

  • Erlaubt dem Benutzer, die Codierung für CSV-Dateien im Ausgabe-Tool anzugeben.

  • Verbesserte Fehlermeldungen, um anzuzeigen, wenn ein ungültiger Speichername angegeben wird.

  • Verbesserte Verarbeitung der Datenkonvertierung, sodass statt einer Warnung ein Fehler ausgegeben wird, wenn ein Feld keinen Wert hat.

  • Fehler behoben, bei dem die angezeigten Dateien/Ordner nicht aktualisiert werden, nachdem der Benutzer den Speichernamen geändert hat.

  • Problem behoben, bei dem die Standardwert-Einstellungen gelegentlich nicht beachtet wurden.

  • Produktionsprotokollierung deaktiviert, um Berechtigungsprobleme für verschiedene Installationen/Konfigurationen von Designer zu verhindern und die Funktion für geplante Workflows zu unterstützen.

v1.0.1

  • Problem behoben, bei dem Pakete nicht erfolgreich installiert werden konnten.

v1.0.0

  • Erste Version für Azure Data Lake-Dateieingabe und Azure Data Lake-Dateiausgabe

Alteryx-Tools für die Verbindung

Data Connection Manager

Die Azure Data Lake Store-Tools Version 2.3.0 und höher unterstützt Data Connection Manager für eine einfachere und sicherere Speicherung Ihrer Anmeldedaten. Stellen Sie eine Verbindung zu Azure Data Lake Store her, um die gespeicherten Anmeldedaten einfach in Workflows wiederverwenden zu können, die Azure Data Lake Store-Tools enthalten. Alteryx Server benötigt gespeicherte Anmeldedaten, um die veröffentlichten Workflows erfolgreich ausführen zu können.

AMP Engine aktivieren

Die AMP Engine muss für Workflows aktiviert sein, die Azure Data Lake Store-Tools ab Version 2.3.0 enthalten.

Authentifizierung und Autorisierung

Die Azure Data Lake-Endpunkte für Gen1- und Gen2-Speicher unterscheiden sich. Während der Authentifizierung müssen Sie angeben, mit welcher Art von Speicher Sie eine Verbindung herstellen möchten. Falls Sie sich nicht sicher sind, welche Art von Speicher Sie verwenden, können Sie Ihren Azure-Administrator fragen oder in Ihrem Microsoft Azure-Portal nachsehen.

TIPPS

  • Verwenden Sie zum Veröffentlichen von Workflows auf Server oder AAH die Authentifizierungstypen Service-to-Service oder gemeinsam verwendeter Schlüssel, damit Sie Ihren Workflow nicht erneut hochladen müssen, sobald Ihr Aktualisierungstoken abläuft.

  • Da das Laden der Metadaten sehr lange dauern kann, können Sie es deaktivieren, indem Sie in den erweiterten Benutzereinstellungen (Optionen > Benutzereinstellungen > Benutzereinstellungen bearbeiten > Erweitert) die Option „Automatische Konfiguration deaktivieren“ auswählen.

Sie müssen Berechtigungen zum Lesen und Schreiben von Daten in einem Azure Data Lake Store-Konto haben. Weitere Informationen zur Zuweisung und Anwendung dieser Berechtigungen finden Sie in der offiziellen Microsoft-Dokumentation.

Single- und Multi-Tenancy

Single-Tenant-Anwendungen sind nur in dem Tenant verfügbar, in dem sie registriert wurden, der auch als deren Haupt-Tenant bezeichnet wird. Sie oder Ihr Azure-Administrator können unter Ihrem Konto Single-Tenant-Azure-Anwendungen und -Speicher erstellen, die Sie während der Authentifizierung in Designer verwenden. Multi-Tenant-Apps sind für Benutzer sowohl in ihrem Start-Tenant als auch in anderen Tenants verfügbar.

Endbenutzer (Basis)

Die einfache Endbenutzer-Authentifizierung ist die bequemste Art, auf Ihre ADLS-Daten in Designer zuzugreifen. Wenden Sie sich an Ihren Azure-Administrator, um die öffentlichen Alteryx-Anwendungen im Azure-Mandanten Ihres Unternehmens zuzulassen. Siehe Microsoft-Dokumentation, in der die Schritte beschrieben werden .

Tenant: Common

ADLS Client ID for the Gen2 Alteryx application: 2584cace-63ff-47cb-96d2-d153704f4d75

Nach der Einrichtung können Sie und Ihre Kollegen Ihre normalen Microsoft-Anmeldedaten verwenden, um auf die ADLS-Daten zuzugreifen.

Endbenutzer (Erweitert)

Die erweiterte Endbenutzer-Authentifizierung unterstützt die Single- und Multi-Tenant-Authentifizierung und kann mit sowohl öffentlichen als auch privaten Anwendungen verwendet werden.

Informationen zum Einrichten der Anmeldedaten finden Sie in den Anweisungen zur Microsoft-Dokumentation .

Authentifizierungskonfiguration

  • Tenant-ID : Sie können die Tenant-ID von Ihrem Azure-Portal erhalten oder sich auf den automatischen Ermittlungsmechanismus in Azure verlassen, indem Sie „common“ in das Feld „Tenant-ID“ eingeben. Bei Zugriff auf mehrere Tenants können Sie die Tenant-ID angeben. Weitere Informationen finden Sie im Abschnitt zu Single- und Multi-Tenancy.

  • Client-ID : die eindeutige Kennung einer Azure-Anwendung. Das Feld „Client-ID“ ist ein Pflichtfeld.

  • Client-Geheimnis : Bei einer privaten Anwendung ist die Bereitstellung eines Client-Geheimnisses obligatorisch. Lassen Sie das Feld leer, wenn Sie eine öffentliche Anwendung verwenden.

Dienst-zu-Dienst

Die Dienst-zu-Dienst-Authentifizierung eignet sich für die Veröffentlichung von Workflows auf Server und Hub.

Informationen zum Einrichten der Anmeldedaten finden Sie in den Anweisungen zur Microsoft-Dokumentation .

Gemeinsam verwendeter Schlüssel

Anmerkung

  • Die Authentifizierung mit dem gemeinsam verwendeten Schlüssel kann nur mit Gen2-Speichern verwendet werden.

  • Die Veröffentlichung auf dem Server funktioniert nur für Designer, Server 2020.4 und neuere Versionen, da diese Authentifizierungsmethode ab den Versionen 2020.4 eingeführt wurde.

Zusammen mit einem Azure-Speicherkonto generiert Microsoft zwei Zugriffsschlüssel, mit denen der Zugriff auf Ihren Azure Data Lake über die „Geteilter Schlüssel“-Autorisierung autorisiert werden kann. Weitere Informationen über den gemeinsam verwendeten Schlüssel und seine Verwendung finden Sie in der Microsoft-Dokumentation .

Azure National Clouds und benutzerdefinierte Endpunkte

Ab Version v2.0 unterstützen die ADLS-Konnektoren den Zugriff auf benutzerdefinierte Endpunkte. Die URLs für die National Clouds in den USA und China können im Dialogfenster Authentifizierung der Konnektoren im Feld „Authentifizierungsstellen-Endpunkt“ ausgewählt werden.

Benutzerdefinierte Microsoft Azure API-Anwendung einrichten

Informationen zum Einrichten einer benutzerdefinierten API-Anwendung für dieses Tool finden Sie in unserem Handbuch.Microsoft Azure API-Anwendung einrichten

Datenauswahl und Konfigurationsoptionen

In der Registerkarte „Daten“ können Sie die Daten angeben, die Sie verwenden möchten:

  1. Geben Sie den Speicherkontonamen an. Dieser Speicher muss vom gleichen Typ sein (Gen1 bzw. Gen2), wie auf der Seite „Authentifizierung“ ausgewählt.

  2. Wählen Sie für Gen2 -Speicher den Dateisystemnamen aus.

  3. Nachdem der Speicher und das Dateisystem für Gen2 ausgewählt wurden, können Sie den Pfad der Datei konfigurieren, in die geschrieben oder die gelesen werden soll. Sie können den Pfad entweder durch direkte Eingabe im Feld „Dateipfad“ oder mithilfe des Dateibrowsers angeben. Bei dem Azure Data Lake-Dateiausgabe-Tool können Sie denselben Mechanismus verwenden, um eine neue Datei zu erstellen.

  4. Bei Excel-Dateien kann der Blattname im Feld „Blatt“ unter dem Dateibrowser angegeben werden. Falls leer, wird automatisch das erste Blatt ausgewählt. Bei neuen Dateien erhält das Blatt den Standardnamen „Blatt“.

Dateiformate und Konfiguration

Die ADLS-Tools unterstützen die folgenden Datenformate: .csv, .avro, .json und .xlsx.

  • CSV-Dateien

    • Lesen

    • Schreiben: Sie können eine vorhandene CSV-Datei überschreiben oder an diese anhängen.

Hinweis

Für die Kompatibilität mit den Eingabedaten- und Datenausgabe-Tools sollte die Codierung UTF-8-SIG verwendet werden.

  • JSON-Dateien

    • Lesen: Um JSON-Dateien richtig lesen zu können, müssen Sie die UTF-8-Codierung ohne BOM verwenden.

    • Schreiben: Die Konvertierung des Datentyps beim Schreiben in JSON-Dateien hat folgende Einschränkungen: Dezimal-, Datum/Uhrzeit- und Uhrzeit-Zellen werden als Strings ausgegeben.

  • Avro-Dateien

    • Lesen

    • Schreiben

  • Excel-Dateien

    • Lesen: Alle Daten werden als V_Wstrings gelesen.

    • Schreiben

Weitere Details

  • Wenn Sie keinen Zugriff (Lesen/Schreiben) auf einen bestimmten Ordner haben, der von einem anderen Konto erstellt wurde, fehlt Ihnen die nötige Berechtigung.

  • Wenn Sie eine Fehlermeldung erhalten, die Sie darauf hinweist, dass das Token möglicherweise widerrufen wurde, müssen Sie sich abmelden und dann wieder im Konfigurationsfenster anmelden, um sich erneut zu authentifizieren.

Anmerkung

Die Eigenschaften der Tokengültigkeitsdauer können vom Systemadministrator konfiguriert werden.

Der Azure Data Lake-Explorer muss Berechtigungen zum Lesen und Schreiben von Daten innerhalb eines Azure Data Lake Store-Kontos gewähren. Weitere Informationen zur Zuweisung und Anwendung dieser Berechtigungen finden Sie in der offiziellen Microsoft-Dokumentation.

Einschränkungen

Ab Version 2.5.0 der Azure Data Lake Store-Tools wird die Gen1-Authentifizierung nicht mehr unterstützt.

JSON und Avro unterstützen nur UTF-8.

Bei JSON tritt ein automatischer Konvertierungsfehler auf, wenn Sie versuchen, Zahlen zu speichern, die für ihren Datentyp zu groß sind.

Das Schreiben in Excel-Dateien ist derzeit auf das vollständige Überschreiben von Dateien beschränkt.

Avro-Dateien mit Feldern vom Typ „Bytes“ werden nicht unterstützt und schlagen beim Import fehl.

Alteryx-Workflow-Float-Feldwerte werden in der Avro-Zieldatei in „Double“ konvertiert.

Die Microsoft Azure Data Lake-, OneDrive- und Dynamics CRM-Konnektoren unterstützen die Authentifizierung über Microsoft-Benutzeranmeldedaten wie E-Mail-Adressen und Kennwörter. In interaktiven Workflows ist es derzeit nicht möglich, sich mit verschiedenen Microsoft-Benutzerkonten über diese Konnektoren zu authentifizieren. Diese Einschränkung hat keine Auswirkungen auf geplante Workflows. Wenn Sie mit einem Microsoft-Benutzerkonto in einem dieser Konnektoren authentifiziert werden und versuchen, sich bei einem anderen Konnektor mit einem anderen Microsoft-Benutzerkonto zu authentifizieren, wird eine Fehlermeldung angezeigt. Befolgen Sie eine der folgenden Empfehlungen, um dieses Problem zu beheben:

  • Der Administrator des Azure Active Directory kann dem Benutzerkonto die erforderlichen Berechtigungen erteilen. Außerdem kann er sicherstellen, dass der Benutzer, der den Workflow erstellt, über ein Benutzerkonto verfügt, das Zugriff auf die in diesem Workflow erforderlichen Dienste hat.

  • Melden Sie sich vor der Anmeldung von allen Konnektoren ab, die bei einem anderen Microsoft-Benutzerkonto authentifiziert sind.

  • Vermeiden Sie die Verwendung der Endbenutzer-Authentifizierung, wenn möglich. Verwenden Sie die Service-to-Service-Authentifizierung in den Azure Data Lake-Konnektoren und die Authentifizierung der Anwendungsanmeldung in den Dynamics CRM-Konnektoren.

Desktop Automation (Planer) wird von diesem Konnektor nicht unterstützt.