Verarbeitung privater Daten
Bei der Verarbeitung privater Daten wird ein Alteryx One Platform-Datenverarbeitungscluster innerhalb Ihrer eigenen virtuellen privaten Cloud (VPC) in AWS, Azure oder auf der Google Cloud Platform ausgeführt. Diese Kombination aus Ihrer Infrastruktur zusammen mit Alteryx-verwalteten/verwalteter GCP-Ressourcen und -Software wird allgemein als private Rechenebene oder Umgebung für die Verarbeitung privater Daten bezeichnet.
Richten Sie die Verarbeitung privater Daten für Ihren Cloud-Anbieter ein
Folgen Sie diesen Anleitungen, um die Verarbeitung privater Daten für Ihren Cloud-Dienst einzurichten:
Modell der gemeinsamen Verantwortung
Im Szenario der Handhabung privater Daten erfordert Alteryx One klare Verantwortungsgrenzen. Die Matrix zur gemeinsamen Verantwortung stellt diese Verantwortungsgrenzen dar.

Alteryx enthält die Spezifikation für die kontoweiten Ressourcen und die VPC. Bei der Verarbeitung personenbezogener Daten sind Sie für die Umsetzung dieser Spezifikation verantwortlich.
Wenn das Konto und die VPC verfügbar sind, verwaltet Alteryx aktiv die Infrastruktur der Cloud-Ressourcen und die bereitgestellte Software innerhalb der VPC.
Ressource | Kunde | Alteryx |
|---|---|---|
Konto-/abonnement-/projektweite Ressourcen |
| Spezifikation |
Cloud-Netzwerk | VPC/Vnet-Infrastruktur
| Spezifikation |
Cloud-Ressourcen |
| |
Software |
|
Konto-/abonnement-/projektweite Ressourcen
Auf der höchsten Ebene erfordert Alteryx einen Berechtigungssatz zum Ausführen einer privaten Datenebene. Sie sind jedoch Besitzer:in des AWS-Kontos, Azure-Abonnements oder GCP-Projekts und der entsprechenden IAM-Anmeldedaten und IAM-Richtlinien.
Virtual Private Cloud
Auf der nächstniedrigeren Ebene definiert Alteryx eine Spezifikation für die VPC oder das Vnet. Dazu gehört die Definition einer Reihe von Subnetzen, CIDR-Blöcken, Leitungstabellen und Endpunkten.
Sie müssen VPC oder Vnet gemäß dieser Spezifikation implementieren.
Cloud-Ressourcen
Nachdem Sie die Einrichtung des AWS-Kontos und der VPC, des Azure-Abonnements und des Vnet oder des GCP-Projekts und der VPC abgeschlossen haben, melden Sie sich bei Alteryx One an, um den Bereitstellungsprozess auszulösen, der Ihren Cluster für die Verarbeitung privater Daten erstellt.
Alteryx erstellt und verwaltet diese Cloud-Ressourcen in Ihrem Namen.
Cloud-Apps
Nachdem Sie die erforderlichen Ressourcen bereitgestellt haben, stellt Alteryx die Software bereit, die zur Verarbeitung Ihrer Daten innerhalb des privaten Clusters erforderlich ist, und pflegt sie.
Die vollständige Liste der Cloud-Ressourcen hängt davon ab, welche Apps Sie innerhalb Ihrer Umgebung für die Verarbeitung privater Daten aktivieren. Weitere Informationen finden Sie im Abschnitt Cloud-Apps auf der dieser Seite.
Cloud-Ressourcen
Alteryx One verwendet automatisierte Bereitstellungs-Pipelines mit Infrastructure as Code (IaC), um diese Ressourcen für Sie zu erstellen und zu verwalten. Alteryx One verwendet Terraform Cloud, um dies zu verwalten. Terraform ist ein IaC-Tool, mit dem Sie Infrastrukturressourcen über von Menschen lesbare Konfigurationsdateien definieren und verwalten können. Terraform Cloud ist ein SaaS-Produkt von Hashicorp. Ressourcen für die Handhabung privater Daten werden mit einem Satz von Terraform-Dateien, Terraform Cloud-APIs und privaten Terraform Cloud-Agenten erstellt und verwaltet, die im Rahmen einer Alteryx-Infrastruktur ausgeführt werden.
Die vollständige Liste der Cloud-Ressourcen hängt davon ab, welche Apps Sie innerhalb Ihrer Umgebung für die Verarbeitung privater Daten aktivieren. Zu den Ressourcen kann Folgendes gehören:
Objektspeicher: Basisspeicherebene für Dateien (z. B. hochgeladene Datasets, Auftragsausgaben, Datenstichproben, Caching-Dateien und andere temporäre Engine-Dateien).
IAM-Rollen und -Richtlinien: erforderliche Berechtigungen für die Bereitstellung von Cloud-Ressourcen und Software.
Kubernetes: Führt die VM-Instanzen für einige Alteryx One-Dienste und -Aufträge auf der Datenebene aus.
Computing (virtuelle Rechner): Rechenressourcen, die zur Ausführung von Aufträgen und Diensten erforderlich sind.
Secret Manager: Speicherung von Infrastrukturgeheimnissen.
Redis: Dienst-zu-Dienst-Meldungen innerhalb der VPC.
Gemeinsam genutztes Dateisystem: An das Netzwerk angeschlossener Speicher.
Spark-Verarbeitung: (Falls aktiviert) Verarbeitung großer Datenaufträge.
Die spezifischen Dienste variieren je nach Public Cloud-Anbieter wie folgt:
Dienst | AWS | Azure | GCP |
|---|---|---|---|
Objektspeicher | S3 | Blob-Speicher | Google-Speicher |
IAM-Rollen und -Richtlinien | IAM-Rollen IAM-Richtlinien | IAM-Rollen IAM-Richtlinien | IAM-Rollen |
Kubernetes | EKS | AKS | GKE |
Computing (virtuelle Rechner) | EC2 | Virtuelle Rechner | Recheninstanz |
Geheimnisverwaltung | Secret Manager | Schlüsseltresor | Secret Manager |
Redis | Amazon MemoryDB | Azure Cache | Google MemoryStore |
Gemeinsam genutztes Dateisystem | EFS | Azure Files | Google Filestore |
Spark-Verarbeitung | EMR serverlos | Keine Angabe | Keine Angabe |
Cloud-Apps
Alteryx One führt eine Reihe von Aufträgen und Diensten innerhalb der Umgebung für die Verarbeitung privater Daten aus. Die genaue Kombination von Infrastruktur und Software hängt davon ab, welche Alteryx One-Anwendungen Sie dort bereitstellen. Diese Module ermöglichen es, nur die Cloud-Ressourcen und -Software bereitzustellen, die Sie für die Anwendungen benötigen, die Sie ausführen möchten.
Jede Anwendung hat ein definiertes Paket das aus Folgendem besteht:
Erforderliche Berechtigungen.
Erforderliche Netzwerkeinrichtung mit Subnetzen und IP-Bereichen.
Alteryx-verwaltete Cloud-Ressourcen.
Alteryx-verwaltete Software.
Wenn Sie z. B. nur Designer Cloud bereitstellen möchten, gibt es bestimmte Berechtigungen und Subnetze (mit IP-Bereichen), die Sie im Voraus einrichten müssen. Nachdem Sie die Einrichtung abgeschlossen haben, können Sie sich bei Alteryx One anmelden und den Bereitstellungsprozess starten.
Wenn Sie nur Cloud Execution for Desktop bereitstellen möchten, gibt es einen anderen Satz erforderlicher Berechtigungen und Subnetze und ein anderes Kontrollkästchen, das in Alteryx One aktiviert werden muss, wenn Sie die Bereitstellung ausführen.
Wenn Sie beide Pakete auf derselben privaten Rechenebene bereitstellen möchten, müssen Sie beide Sätze von Einrichtungsschritten ausführen und dann den Bereitstellungsschritt für beide durchführen.
Designer Cloud-Paket
Wenn Sie das Designer Cloud-Paket bereitstellen, stellt Alteryx One diese Cloud-Ressourcen bereit.
Erforderliche Dienste
Die genauen Dienstnamen für jeden Cloud-Anbieter finden Sie im Abschnitt „Cloud-Ressourcen“.
Objektspeicher
Kubernetes
Computing
Secret Manager
Redis
Gemeinsam genutztes Dateisystem
(Optional) Spark-Verarbeitung
Knotengruppen und -typen
Im Kubernetes-Cluster stellt Alteryx diese Rechenressourcen für jeden Cloud-Anbieter bereit. Diese Knotentypen und Prioritäten können sich mit der Entwicklung des Cloud-Anbieters im Laufe der Zeit ändern. Derzeit strebt Alteryx ein Gleichgewicht zwischen verschiedenen Faktoren an.
AMD-Rechnertypen sind kostengünstiger als Intel-Rechnertypen.
Einige Auftragstypen werden am besten mit speicheroptimierten oder rechenleistungsoptimierten Knoten ausgeführt. Für einige Cloud-Anbieter sind diese Knotentypen jedoch viel teurer, während die allgemeinen Typen kostengünstiger sind.
AWS ermöglicht Alteryx die Festlegung einer Prioritätsreihenfolge von Knotentypen und stellt diese nach Bedarf in dieser Reihenfolge bereit. Alteryx empfiehlt diese Reihenfolge: speicheroptimierte AMD-Rechnertypen, gefolgt von Intel-Rechnertypen und abschließend allgemeine Rechnertypen.
Knotengruppentyp | AWS | Azure | GCP |
|---|---|---|---|
| t3a.2xlarge t3.2xlarge | Standard_D2s_v3 | n2d-standard-2 |
| r6a.2xlarge r6i.2xlarge m6a.4xlarge m6i.4xlarge | Standard_B16as_v2 | n2d-standard-16 |
| Wie bei | Wie bei | Wie bei |
| Wie bei | Wie bei | Wie bei |
| Wie bei | Wie bei | Wie bei |
Die Knotengruppen convert, data-system, file-system und photon haben eine minimale Skalierungsgröße von 1 und eine maximale Skalierungsgröße von 30.
Software
Innerhalb des Kubernetes-Clusters verwendet das Designer Cloud-Paket sowohl bedarfsgesteuerte Aufträge als auch Dienste mit langer Ausführungszeit.
Bedarfsgesteuerte Aufträge in Kubernetes
Für bedarfsgesteuerte Aufträge in Kubernetes ruft Alteryx One ein Container-Image (aus dem Zwischenspeicher oder aus einem zentralen Speicher) ab und stellt es in einem flüchtigen Pod bereit, der für die Dauer des Auftrags anhält. Alle ausführbaren Dateien sind in Java oder Python geschrieben.
conversion-jobs: Datasets innerhalb eines Workflows nach Bedarf aus einem Format in ein anderes konvertieren.
connectivity-jobs: Zur Laufzeit eine Verbindung zu externen Datensystemen herstellen.
photon-jobs: Photon ist eine Laufzeit-Engine zur Vorbereitung und Zusammenführung im Speicher zur Laufzeit für kleinere Dataset-Größen.
amp-jobs: AMP ist eine Laufzeit-Engine von Alteryx zur Vorbereitung und Zusammenführung im Speicher, die hauptsächlich in Designer Experience eingesetzt wird.
publish-jobs: Verarbeitete Daten in das Ausgabeziel schreiben, das im Workflow angegeben ist.
Kubernetes-Dienste mit langer Ausführungszeit
Alteryx verwendet die Argo CD, um Dienste mit langer Ausführungszeit in Ihrem Kubernetes-Cluster bereitzustellen und zu verwalten. Argo CD ist ein deklaratives GitOps-Tool zur kontinuierlichen Bereitstellung für Kubernetes.
Die meisten Dienste mit langer Ausführungszeit im Cluster bieten eine Hilfsprogramm-Funktion, mit der Alteryx den Clusterzustand überwachen, den Cluster nach oben und unten skalieren und Geheimnisse in den Cloud-nativen Schlüsselspeicher und den Kubernetes-Geheimnisspeicher importieren bzw. daraus exportieren kann. Diese Dienste sind bei allen Paketen, die Kubernetes verwenden, gleich und es wird immer nur 1 Instanz dieser Dienste gleichzeitig ausgeführt, selbst wenn Sie mehrere Pakete angeben, die sie benötigen.
teleport-agent: Richtet eine sichere Methode für Alteryx-SRE zur Verbindung mit dem Cluster für die Fehlerbehebung ein. Alteryx One ruft das Helm Chart aus dem Repository https://charts.releases.teleport.dev ab. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
datadog-agent: Erfasst Protokolle und Metriken aus dem Cluster. Alteryx One ruft das Helm Chart aus dem Repository https://helm.datadoghq.com ab. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
keda: Automatische Skalierung von Diensten mit langer Ausführungszeit basierend auf benutzerdefinierten Metriken mit Kafka-Support. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
external-secrets: Zwischen AWS Secret Manager oder Schlüsseltresorgeheimnissen in den und aus Kubernetes Secrets Store importieren/exportieren. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
cluster-autoscaler: EKS-, AKS- oder GKE-Knoten auf Basis des Pod-Bedarfs skalieren. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
metrics-server: EKS, AKS oder GKE erlauben, die Metrik-API zu verwenden. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
kubernetes-reflector: Replikation des
dockerConfigJson-Geheimnisses über alle Namespaces hinweg. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
Das Designer Cloud-Paket stellt auch Dienste mit langer Ausführungszeit bereit, die speziell auf die jeweiligen Anforderungen zugeschnitten sind.
data-service: Stellt zur Designzeit eine Verbindung zu externen Datensystemen über die JDBC-API her. Alteryx hat diesen Dienst entwickelt. Snyk scannt das Image auf Sicherheitslücken.
Anmerkung
Alteryx muss gelegentlich die erforderlichen Berechtigungen oder die Netzwerkkonfiguration aktualisieren, wenn sich Cloud-Anwendungen weiterentwickeln. Da Sie diese Komponenten besitzen, wird Alteryx Sie über die erforderlichen Änderungen informieren. Sie haben 60 Tage Zeit, die Aktualisierungen vorzunehmen. Anschließend verwendet Alteryx die neuen Anwendungsversionen. Wenn Sie die erforderliche Maßnahme bis dahin nicht abgeschlossen haben, kann es zu einer Verschlechterung oder Unterbrechung der Datenverarbeitung in Ihrer privaten Umgebung kommen.
Cloud Execution for Desktop-Paket
Wenn Sie das Cloud Execution for Desktop-Paket bereitstellen, stellt Alteryx One diese Cloud-Ressourcen bereit.
Erforderliche Dienste
Das Cloud Execution for Desktop-Paket verwendet kein Kubernetes. Stattdessen stellt das Paket ein Rechner-Image bereit, das die gesamte erforderliche Software zur Ausführung von Designer Desktop Workflows enthält. Daher nutzt das Paket nur den Rechendienst des jeweiligen Cloud-Anbieters. Die genauen Dienstnamen für jeden Cloud-Anbieter finden Sie im Abschnitt „Cloud-Ressourcen“.
Computing
Gruppen und Knotentypen automatisch skalieren
Cloud Execution for Desktop stellt zwei oder mehr virtuelle Rechner in einer Autoskalierungsgruppe bereit.
Diese Knotentypen und Prioritäten können sich mit der Entwicklung des Cloud-Anbieters im Laufe der Zeit ändern. Derzeit strebt Alteryx ein Gleichgewicht zwischen verschiedenen Faktoren an.
AMD-Rechnertypen sind kostengünstiger als Intel-Rechnertypen.
AWS ermöglicht Alteryx die Festlegung einer Prioritätsreihenfolge von Knotentypen und stellt diese nach Bedarf in dieser Reihenfolge bereit. Alteryx empfiehlt diese Reihenfolge: speicheroptimierte AMD-Rechnertypen, gefolgt von Intel-Rechnertypen und abschließend allgemeine Rechnertypen.
AWS | Azure | GCP | |
|---|---|---|---|
Knotentyp | m5a.4xlarge | Standard_B16as_v2 | n2d-standard-16 |
Software
Auf einem virtuellen Rechner führt das Cloud Execution for Desktop-Paket einige Hilfsprogrammdienste zur Überwachung sowie die Engine-Worker aus, die Designer Desktop-Aufträge verarbeiten.
cefd-worker: Diese Worker führen die speicherinterne Alteryx-Engine aus, um Verbindungen zu Datenquellen herzustellen, Daten zu verarbeiten und Auftragsausgaben zu veröffentlichen. Aufträge werden containerisiert und auf dem virtuellen Rechner in einem Container ausgeführt.
consumer-service: Dieser Dienst verbraucht Meldungen aus einer Kafka-Warteschlange, die von einem Alteryx One-Dienst auf der Steuerungsebene gespeist wird. Diese Meldungen sind der Auslöser für die Ausführung eines Workflows.
teleport-agent: Richtet eine sichere Methode für Alteryx-SRE zur Verbindung mit dem Cluster für die Fehlerbehebung ein. Alteryx One ruft das Helm Chart aus dem Repository https://charts.releases.teleport.dev ab. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
datadog-agent: Erfasst Protokolle und Metriken aus dem Cluster. Alteryx One ruft das Helm Chart aus dem Repository https://helm.datadoghq.com ab. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
Machine Learning-Paket
Wenn Sie das Machine Learning-Paket bereitstellen, stellt Alteryx One diese Cloud-Ressourcen bereit.
Erforderliche Dienste
Die genauen Dienstnamen für jeden Cloud-Anbieter finden Sie im Abschnitt „Cloud-Ressourcen“.
Objektspeicher
Kubernetes
Computing
Secret Manager
Redis
Gemeinsam genutztes Dateisystem
(Optional) Spark-Verarbeitung
Knotengruppen und -typen
Innerhalb des Kubernetes-Clusters stellen wir die folgenden Rechenressourcen für jeden Cloud-Anbieter bereit. Diese Knotentypen und Prioritäten können sich mit der Entwicklung des Cloud-Anbieters im Laufe der Zeit ändern. Im Moment streben wir ein Gleichgewicht zwischen einigen Faktoren an:
AMD-Rechnertypen sind kostengünstiger als Intel-Rechnertypen.
Einige Auftragstypen werden am besten mit speicheroptimierten oder rechenoptimierten Knoten ausgeführt, aber bei einigen Cloud-Anbietern sind diese Knotentypen wesentlich teurer, während die allgemeinen Knotentypen deutlich günstiger sind.
AWS ermöglicht es uns, eine Prioritätsreihenfolge von Knotentypen festzulegen, die nach Bedarf in der festgelegten Reihenfolge bereitgestellt werden. Wir bevorzugen speicheroptimierte AMD-Rechnertypen. Als Zweites greifen wir auf Intel-Rechnertypen zurück und schließlich auf allgemeine Rechnertypen.
Knotengruppentyp | AWS | Azure | GCP |
|---|---|---|---|
| t3a.2xlarge t3.2xlarge | Standard_D2s_v3 | n2d-standard-2 |
| r6a.2xlarge r6i.2xlarge m6a.4xlarge m6i.4xlarge | Standard_B16as_v2 | n2d-standard-16 |
Die automl-Knotengruppe hat eine minimale Skalierungsgröße von 1 und eine maximale Skalierungsgröße von 30.
Software
Innerhalb des Kubernetes-Clusters verwendet das Machine Learning-Paket sowohl bedarfsgesteuerte Aufträge als auch Dienste mit langer Ausführungszeit.
Bedarfsgesteuerte Aufträge in Kubernetes
Für bedarfsgesteuerte Aufträge in Kubernetes ruft Alteryx One ein Container-Image (aus dem Zwischenspeicher oder aus einem zentralen Speicher) ab und stellt es in einem flüchtigen Pod bereit, der für die Dauer des Auftrags anhält.
automl-jobs: Auftragsdienst für Modelltraining und -ausführung.
Kubernetes-Dienste mit langer Ausführungszeit
Alteryx verwendet die Argo CD, um Dienste mit langer Ausführungszeit in Ihrem Kubernetes-Cluster bereitzustellen und zu verwalten. Argo CD ist ein deklaratives GitOps-Tool zur kontinuierlichen Bereitstellung für Kubernetes.
Die meisten Dienste mit langer Ausführungszeit im Cluster bieten eine Hilfsprogramm-Funktion, mit der Alteryx den Clusterzustand überwachen, den Cluster nach oben und unten skalieren und Geheimnisse in den Cloud-nativen Schlüsselspeicher und den Kubernetes-Geheimnisspeicher importieren bzw. daraus exportieren kann. Diese Dienste sind bei allen Paketen, die Kubernetes verwenden, gleich und es wird immer nur 1 Instanz dieser Dienste gleichzeitig ausgeführt, selbst wenn Sie mehrere Pakete angeben, die sie benötigen.
teleport-agent: Richtet eine sichere Methode für Alteryx-SRE zur Verbindung mit dem Cluster für die Fehlerbehebung ein. Alteryx One ruft das Helm Chart aus dem Repository https://charts.releases.teleport.dev ab. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
datadog-agent: Erfasst Protokolle und Metriken aus dem Cluster. Alteryx One ruft das Helm Chart aus dem Repository https://helm.datadoghq.com ab. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
keda: Automatische Skalierung von Diensten mit langer Ausführungszeit basierend auf benutzerdefinierten Metriken mit Kafka-Support. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
external-secrets: Zwischen AWS Secret Manager oder Schlüsseltresorgeheimnissen in den und aus Kubernetes Secrets Store importieren/exportieren. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
cluster-autoscaler: EKS-, AKS- oder GKE-Knoten auf Basis des Pod-Bedarfs skalieren. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
metrics-server: EKS, AKS oder GKE erlauben, die Metrik-API zu verwenden. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
kubernetes-reflector: Replikation des
dockerConfigJson-Geheimnisses über alle Namespaces hinweg. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
Auto Insights-Paket
Wenn Sie das Auto Insights-Paket bereitstellen, stellt Alteryx One diese Cloud-Ressourcen bereit.
Erforderliche Dienste
Die genauen Dienstnamen für jeden Cloud-Anbieter finden Sie im Abschnitt „Cloud-Ressourcen“.
Objektspeicher
Kubernetes
Computing
Secret Manager
Redis
Gemeinsam genutztes Dateisystem
Knotengruppen und -typen
Innerhalb des Kubernetes-Clusters stellen wir die folgenden Rechenressourcen für jeden Cloud-Anbieter bereit. Diese Knotentypen und Prioritäten können sich mit der Entwicklung des Cloud-Anbieters im Laufe der Zeit ändern. Im Moment streben wir ein Gleichgewicht zwischen einigen Faktoren an:
AMD-Rechnertypen sind kostengünstiger als Intel-Rechnertypen.
Einige Auftragstypen werden am besten mit speicheroptimierten oder rechenoptimierten Knoten ausgeführt, aber bei einigen Cloud-Anbietern sind diese Knotentypen wesentlich teurer, während die allgemeinen Knotentypen deutlich günstiger sind.
AWS ermöglicht es uns, eine Prioritätsreihenfolge von Knotentypen festzulegen, die nach Bedarf in der festgelegten Reihenfolge bereitgestellt werden. Wir bevorzugen speicheroptimierte AMD-Rechnertypen. Als Zweites greifen wir auf Intel-Rechnertypen zurück und schließlich auf allgemeine Rechnertypen.
Knotengruppentyp | AWS | Azure | GCP |
|---|---|---|---|
| t3a.2xlarge t3.2xlarge | Standard_D2s_v3 | n2d-standard-2 |
| r6a.2xlarge r6i.2xlarge m6a.4xlarge m6i.4xlarge | Standard_B16as_v2 | n2d-standard-16 |
Die Knotengruppe common-job hat eine minimale Skalierungsgröße von 1 und eine maximale Skalierungsgröße von 30.
Software
Innerhalb des Kubernetes-Clusters verwendet das Auto Insights-Paket sowohl bedarfsgesteuerte Aufträge als auch Dienste mit langer Ausführungszeit.
Bedarfsgesteuerte Aufträge in Kubernetes
Für bedarfsgesteuerte Aufträge in Kubernetes ruft Alteryx One ein Container-Image (aus dem Zwischenspeicher oder aus einem zentralen Speicher) ab und stellt es in einem flüchtigen Pod bereit, der für die Dauer des Auftrags anhält.
Auto Insights-Aufträge werden von Airflow orchestriert.
data-uploader: Auftragsdienst für die Aufnahme von Datasets aus dem VFS in ClickHouse.
Kubernetes-Dienste mit langer Ausführungszeit
Alteryx verwendet die Argo CD, um Dienste mit langer Ausführungszeit in Ihrem Kubernetes-Cluster bereitzustellen und zu verwalten. Argo CD ist ein deklaratives GitOps-Tool zur kontinuierlichen Bereitstellung für Kubernetes.
Die meisten Dienste mit langer Ausführungszeit im Cluster bieten eine Hilfsprogramm-Funktion, mit der Alteryx den Clusterzustand überwachen, den Cluster nach oben und unten skalieren und Geheimnisse in den Cloud-nativen Schlüsselspeicher und den Kubernetes-Geheimnisspeicher importieren bzw. daraus exportieren kann. Diese Dienste sind bei allen Paketen, die Kubernetes verwenden, gleich und es wird immer nur 1 Instanz dieser Dienste gleichzeitig ausgeführt, selbst wenn Sie mehrere Pakete angeben, die sie benötigen.
teleport-agent: Richtet eine sichere Methode für Alteryx-SRE zur Verbindung mit dem Cluster für die Fehlerbehebung ein. Alteryx One ruft das Helm Chart aus dem Repository https://charts.releases.teleport.dev ab. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
datadog-agent: Erfasst Protokolle und Metriken aus dem Cluster. Alteryx One ruft das Helm Chart aus dem Repository https://helm.datadoghq.com ab. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
keda: Automatische Skalierung von Diensten mit langer Ausführungszeit basierend auf benutzerdefinierten Metriken mit Kafka-Support. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
external-secrets: Zwischen AWS Secret Manager oder Schlüsseltresorgeheimnissen in den und aus Kubernetes Secrets Store importieren/exportieren. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
cluster-autoscaler: EKS-, AKS- oder GKE-Knoten auf Basis des Pod-Bedarfs skalieren. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
metrics-server: EKS, AKS oder GKE erlauben, die Metrik-API zu verwenden. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
kubernetes-reflector: Replikation des
dockerConfigJson-Geheimnisses über alle Namespaces hinweg. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
Das Auto Insights-Paket stellt auch Dienste mit langer Ausführungszeit bereit, die speziell auf die jeweiligen Anforderungen zugeschnitten sind.
Clickhouse: Ein spaltenorientiertes Open-Source-Datenbankmanagementsystem für die Speicherung von Auto Insights-Datasets. Das Helm Chart wurde von Alteryx entwickelt und verwendet ein Drittanbieter-Image von https://hub.docker.com/r/clickhouse/clickhouse-server. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
altinity-clickhouse-operator: Ein Open-Source-Kubernetes-Operator zur Verwaltung der Bereitstellung von ClickHouse. Das Helm Chart wurde von Alteryx entwickelt und basiert auf Kubernetes-Ressourcen von https://github.com/Altinity/clickhouse-operator/blob/master/deploy/operator/clickhouse-operator-install-bundle.yaml. Es verwendet ein Drittanbieter-Image von https://hub.docker.com/r/altinity/clickhouse-operator. Alteryx scannt dieses Drittanbieter-Anbieter nicht.
airflow: Ein Open-Source-Dienst für das Workflow-Management zum Orchestrieren von bedarfsgesteuerten Aufträgen für Auto Insights, wie die Aufnahme von Datasets in ClickHouse. Alteryx One ruft das Helm Chart aus https://github.com/apache/airflow/tree/main/chart ab. Um zusätzliche Pakete zu installieren, verwaltet und scannt Alteryx ein Fork des Drittanbieter-Image von https://hub.docker.com/r/apache/airflow.
query-engine: Eine Anwendung für die Aufnahme von Auto Insights-Datasets in die private Datenebene und die Ausführung von Abfragen für diese Datasets von der Steuerungsebene.
Geschäftskontinuität
Umgebungen für die Verarbeitung privater Daten sind in Regionen mit mindestens 3 Verfügbarkeitszonen verfügbar. Dadurch kann die Umgebung zur Verarbeitung privater Daten in zwei Verfügbarkeitszonen ausgeführt werden und im Fehlerfall auf die dritte Umgebung ausweichen.
Die Erstellung von Sicherungen für den privaten Objektspeicher liegt in Ihrer Verantwortung.
Je nach Auftragstyp werden Datenverarbeitungsaufträge entweder in einem flüchtigen Pod in einem Kubernetes-Cluster oder in einem Container in einem virtuellen Rechner ausgeführt. Wenn sich ein Ausfall auf einen aktiv ausgeführten Auftrag auswirkt, schlägt der Auftrag wahrscheinlich fehl und Sie müssen ihn erneut ausführen.
Unterstützte Regionen
Wenn Sie eine Umgebung für die Verarbeitung privater Daten in einer bestimmten Region betreiben möchten, stellt Alteryx One die folgenden Anforderungen:
Die Region muss mindestens 3 Verfügbarkeitszonen aufweisen.
Die Region muss die erforderlichen Cloud-Ressourcen bereitstellen, wie im Abschnitt „Cloud-Ressourcen“ beschrieben.
Die Region muss die erforderlichen Knotentypen bereitstellen, wie im Abschnitt „Cloud-Apps“ beschrieben.
Hier sind die verfügbaren Regionen für jeden Cloud-Anbieter:
Globale Cloud-Region | Region | AWS | Azure | GCP |
|---|---|---|---|---|
Afrika | Johannesburg, Südafrika | southafricanorth | ||
Asiatisch-pazifischer Raum | Delhi, Indien | asia-south2 | ||
Hongkong | ap-east-1 | eastasia | asia-east2 | |
Indonesien | asia-southeast2 | |||
Mumbai, Indien | ap-south-1 | asia-south1 | ||
Pune, Indien | centralindia | |||
Osaka, Japan | asia-northeast2 | |||
Seoul, Südkorea | ap-northeast-2 | koreacentral | asia-northeast3 | |
Singapur | ap-southeast-1 | southeastasia | asia-southeast1 | |
Sydney, Australien | ap-southeast-2 | australiaeast | australia-southeast1 | |
Taiwan | asia-east1 | |||
Tokio, Japan | ap-northeast-1 | japaneast | asia-northeast1 | |
Europa | Belgien | europe-west1 | ||
Berlin, Deutschland | europe-west10 | |||
Finnland | europe-north1 | |||
Frankfurt, Deutschland | eu-central-1 | germanywestcentral | europe-west3 | |
Gävle, Schweden | swedencentral | |||
Irland | eu-west-1 | northeurope | ||
London, Vereinigtes Königreich | eu-west-2 | uksouth | europe-west2 | |
Madrid, Spanien | europe-southwest1 | |||
Mailand, Italien | europe-west8 | |||
Niederlande | westeurope | europe-west4 | ||
Oslo, Norwegen | norwayeast | |||
Paris, Frankreich | eu-west-3 | francecentral | europe-west9 | |
Stockholm, Schweden | eu-north-1 | |||
Turin, Italien | europe-west12 | |||
Warschau, Polen | polandcentral | europe-central2 | ||
Zürich, Schweiz | switzerlandnorth | |||
Naher Osten | Katar | qatarcentral | ||
Vereinigte Arabische Emirate | uaenorth | |||
Nordamerika | Arizona | westus3 | ||
Kalifornien | us-west2 | |||
Iowa | centralus | us-central1 | ||
Montreal, Kanada | ca-central-1 | northamerica-northeast1 | ||
Toronto, Kanada | canadacentral | |||
Nevada | us-west4 | |||
North Virginia | us-east-1 | |||
Ohio | us-east-2 | us-east5 | ||
Oregon | us-west-2 | us-west1 | ||
South Carolina | us-east1 | |||
Texas | southcentralus | |||
Utah | us-west3 | |||
Virginia | eastus | us-east4 | ||
eastus2 | ||||
Washington | westus2 | |||
Südamerika | São Paulo, Brasilien | sa-east-1 | brazilsouth | southamerica-east1 |