Seite „Daten Importieren“
Anmerkung
Alteryx One Platform erwartet bei dateibasierten Quellen, dass jede Datenzeile in der Importdatei mit einem konsistenten Zeilenumbruchzeichen beendet wird, einschließlich der letzten Zeile in der Datei.
Bei einzelnen Dateien, die dieses letzte Zeilenumbruchzeichen nicht enthalten, wird der endgültige Datensatz möglicherweise gelöscht.
Bei Importen aus mehreren Dateien, bei denen im endgültigen Datensatz einer Datei ein Zeilenumbruch fehlt, kann dieser endgültige Datensatz mit dem ersten in der nächsten Datei zusammengeführt und dann in der laufenden Trifacta Photon-Umgebung entfernt werden.
Allgemeine Einschränkungen
Anmerkung
Ein importiertes Dataset erfordert etwa 15 Zeilen, um Spaltendatentypen (für nicht relationale Quellen) und die Zeile, falls vorhanden, korrekt abzuleiten, um sie für Spaltenüberschriften zu verwenden.
Datei- und Pfadeinschränkungen:
Der Doppelpunkt (
:) darf nicht in einem Dateinamen oder Dateipfad vorkommen.Dateinamen dürfen nicht mit Sonderzeichen wie Punkt (
.) oder Unterstrich (_) beginnen.Eingabedatei- oder Tabellenpfade dürfen maximal 1.024 Zeichen lang sein.
Grundlegende Aufgabe
1. Verbindung zu den Quellen herstellen
identifiziert während des Imports Dateiformate basierend auf der Erweiterung des Dateinamens.
Komprimierte Dateien werden erkannt und können basierend auf ihren Dateierweiterungen importiert werden.
Dateinamen ohne Erweiterung werden als TXT-Dateien behandelt.
Hochladen:Alteryx One kann auch Dateien aus Ihrem lokalen Dateisystem laden.
Tipp
Sie können Dateien per Drag-and-Drop von Ihrem Desktop hochladen.
Anmerkung
Sie können eine Datei mit einer Größe von bis zu 1 GB hochladen.
Anmerkung
Wenn Sie eine aktualisierte Version einer zuvor hochgeladenen Datei hochladen, wird die neue Datei als separater Upload gespeichert. Wenn Sie das importierte Dataset auf der Grundlage der vorherigen Version verwenden, müssen Sie das alte Dataset durch das neue ersetzen, um auf dieses zu verweisen.
Trifacta: Wenn Sie Alteryx Data Storage (ADS) für Ihren Arbeitsbereich aktiviert haben, können Sie auf Dateien aus ADS zugreifen, die Sie in den Arbeitsbereich hochgeladen haben. Diese Dateien können die Quelle für die Erstellung Ihrer importierten Datasets sein.
Anmerkung
ADS kann aktiviert werden, wenn dies noch nicht der Fall ist. Weitere Informationen finden Sie unter Speicherumgebung konfigurieren.
Weitere Informationen finden Sie im ADS-Browser.
S3: Wenn Sie mit einer S3-Instanz verbunden sind, können Sie Ihre S3-Buckets durchsuchen, um Quelldateien auszuwählen.
Tipp
Für S3 können Sie Ordner auswählen, die jede Datei innerhalb des Verzeichnisses als separates Dataset auswählen.
Siehe Externe S3-Verbindungen.
Redshift: Wenn Sie mit einem S3-Data-Warehouse verbunden sind, können Sie die Quelle aus der verbundenen Datenbank importieren. Weitere Informationen finden Sie unter Amazon Redshift-Verbindungen.
Datenbanken: Wenn Sie mit einem relationalen Datenspeicher verbunden sind, können Sie Tabellen oder Ansichten aus Ihrer Datenbank laden. Siehe Datenbank-Browser.
Anmerkung
Bei relationalen Quellen mit langem Ladevorgang können Sie den Fortschritt in jeder Phase der Aufnahme überwachen. Nachdem diese Quellen aufgenommen wurden, können die nachfolgenden Schritte zum Importieren und Verarbeiten der Daten effizienter sein.
Weitere Informationen finden Sie unter Übersicht: Auftragsausführung.
Weitere Informationen zu den unterstützten Eingabeformaten finden Sie unter Unterstützte Dateiformate.
Neu/Bearbeiten: Klicken Sie, um eine Verbindung zu erstellen oder zu bearbeiten. Standardmäßig unterstützen die angezeigten Verbindungen den Import.
Suchen: Geben Sie einen Suchbegriff ein, um eine bestimmte Verbindung zu finden.
Weitere Informationen finden Sie im Fenster „Verbindung erstellen“.
2. Datasets hinzufügen
Wenn Sie Ihr Quellverzeichnis oder Ihre Datei gefunden haben:
Sie können den Mauszeiger über den Namen einer Datei bewegen, um eine Vorschau des Inhalts anzuzeigen.
Anmerkung
Für einige Quellen, wie z. B. Parquet, ist die Vorschau möglicherweise nicht verfügbar.
Klicken Sie auf das Plussymbol neben dem Namen des Verzeichnisses oder der Datei, um sie als Dataset hinzuzufügen.
Tipp
Sie können mehrere Datasets gleichzeitig importieren. Siehe unten.
Excel-Dateien: Klicken Sie auf das Plussymbol neben der übergeordneten Arbeitsmappe, um alle Arbeitsblätter als einzelnes Dataset hinzuzufügen. Alternativ können Sie auch einzelne Arbeitsblätter als separate Datasets hinzufügen.
Wenn die benutzerdefinierte SQL-Abfrage aktiviert ist, wählen Sie Dataset mit SQL erstellen aus, um eine benutzerdefinierte SQL-Anweisung einzugeben und die Tabelle in der Datenbank vorzufiltern, sodass nur die relevanten Zeilen und Spalten einbezogen werden.
Weitere Informationen finden Sie unter Dataset mit SQL erstellen.
Wenn die Parametrisierung aktiviert wurde, können Sie Parameter auf die Quellpfade Ihrer Datasets anwenden, um eine größere Gruppe von Quellen zu erfassen. Wählen Sie Dataset mit Parametern erstellen aus. Gehen Sie zu Dataset mit Parametern erstellen. Um ausgeblendete Dateien oder Ordner anzuzeigen, wählen Sie Ausgeblendete einblenden aus.
Anmerkung
Ausgeblendete Ordnernamen beginnen mit einem Punkt (.) oder Unterstrich (_). Im Allgemeinen werden diese Ordner aus einem bestimmten Grund ausgeblendet. Dateistrukturen können sich ohne Vorankündigung ändern.
3. Auswahlen konfigurieren
Wenn ein Dataset ausgewählt wurde, werden die folgenden Felder auf der rechten Seite des Bildschirms angezeigt. Nehmen Sie nach Bedarf Änderungen vor:
Dataset-Name: Dieser Name wird in der Benutzeroberfläche angezeigt.
Dataset-Beschreibung: Sie können eine optionale Beschreibung hinzufügen, die zusätzliche Details zum Dataset enthält. Diese Informationen sind in einigen Bereichen der Benutzeroberfläche sichtbar.
Tipp
Klicken Sie auf das Augensymbol, um den Inhalt des Datasets vor dem Import zu prüfen.
Tipp
Sie können ein einzelnes Dataset oder mehrere Datasets für den Import auswählen.
4. Auswahl importieren
Wenn Sie ein Dataset mit Parametern aus mehreren Dateien importieren, wird nur die erste übereinstimmende Datei im rechten Bereich angezeigt.
Im Bereich können Sie eine Vorschau der einzelnen Datasets anzeigen und nach Bedarf Änderungen vornehmen.