Eingabedaten-Tool
One-Tool-Beispiel
Es gibt ein One-Tool-Beispiel für das Eingabedaten-Tool. Unter Beispiel-Workflows erfahren Sie, wie Sie dieses und viele weitere Beispiele direkt in Alteryx Designer aufrufen können.
Verwenden Sie das Eingabedaten-Tool, um Daten durch Verbindung mit einer Datei oder Datenbank in Ihren Workflow zu importieren.
Anmerkung
Bei der Verwendung von Platzhaltern zum Lesen mehrerer CSV-Dateien mit dem verteilten Hadoop-Dateisystem wird ein Fehler ausgegeben.
Tool-Konfiguration
Das Konfigurationsfenster des Eingabedaten-Tools besteht aus zwei Abschnitten: Datei oder Datenbank verbinden und Optionen .
Datei oder Datenbank verbinden
Die folgenden Schritte beschreiben den Prozess bei deaktiviertem Data Connection Manager (DCM). Wenn die Option aktiviert ist, wird die Dropdown-Liste Datei oder Datenbank verbinden durch die Schaltfläche Eine Verbindung einrichten ersetzt, mit der das Fenster Datenverbindungen geöffnet werden kann, in dem nur vom DCM unterstützte Datenquellen angezeigt werden und in dem DCM durch Auswahl einer Technologie geöffnet werden kann.
Führen Sie die folgenden Schritte aus, nachdem Sie das Eingabedaten-Tool auf den Canvas gezogen haben:
Wählen Sie im Konfigurationsfenster das Dropdown-Menü Eine Datei oder Datenbank verbinden aus.
Designer zeigt das Fenster Datenverbindungen an. Konfigurieren Sie Ihre Datenverbindung mit einer der folgenden Optionen: Zuletzt verwendet , Gespeichert , Dateien , Datenquellen oder Server .
Der Abschnitt Zuletzt verwendete Verbindungen enthält vor kurzem konfigurierte Dateien und Datenverbindungen. Sie können eine aktuelle Verbindung wählen oder Liste löschen auswählen, um die letzten Verbindungen zu löschen.
Wählen Sie unter Gespeichert eine gespeicherte Verbindung aus. Um Ihre Verbindungen umzubenennen und zu bearbeiten, verwenden Sie Gespeicherte Verbindungen verwalten .
Um eine Verbindung mit einer Datei in einem lokalen Verzeichnis oder Netzwerkverzeichnis herzustellen, gibt es vier Optionen:
Wählen Sie unter Datei oder Datenbankverbindung die Option Dateien aus, um zu einer Datei zu navigieren.
Ziehen Sie eine Datei auf Dateiverbindungen .
Wählen Sie unter Alle unterstützten Dateitypen eine Dateityperweiterung aus, um zu einer Datei dieses Typs zu navigieren.
Schließen Sie Datenverbindungen und ziehen Sie eine Datei direkt auf den Canvas.
Datenquellen
Unter „Datenquellen" Finden Sie unterstützte und häufig verwendete Datenquellen an.
Tools: Wenn Sie für ein nicht installiertes Tool Schnellverbindung auswählen, öffnet sich ein Browser zur Alteryx Community, damit Sie dieses Tool herunterladen und installieren können. Lesen Sie die Anweisungen auf der Seite sorgfältig durch. Nach der Installation des Tools ändert sich das Eingabedaten-Tool auf dem Canvas in das Tool, das Sie auf der Datenquellen-Registerkarte ausgewählt haben.
Datenquellen:
ODBC startet das ODBC-Verbindungsfenster, das eine gefilterte Liste von DSNs auf dem System anzeigt, die diesen bestimmten Treiber verwenden.
OleDB startet den systemeigenen Windows OleDB-Manager.
OCI startet den systemeigenen Oracle OCI-Verbindungs-Manager. Wählen Sie von hier aus den Netzdienstnamen, wie er in Ihrer Datei tnsnames.ora definiert ist, den Sie für diese Verbindung verwenden wollen, sowie den Benutzernamen und das Kennwort für die Anmeldung.
Bulk öffnet ein spezielles Dialogfeld, in dem Sie eine Bulk-Verbindung für den ausgewählten Verbindungstyp einrichten können.
Schnellverbindung: Für SQL oder Oracle Schnellverbindungen können Sie entweder eine bereits vorhandene gespeicherte Verbindung verwenden oder eine neue gespeicherte Verbindung erstellen. Weitere Informationen finden Sie auf diesen Seiten:
Alle anderen Schnellverbindungen verwenden ein anderes Tool.
Server
Server zeigt jede Alteryx Server-Benutzeroberfläche und ihre URL an, die auf dem lokalen Computer hinzugefügt wurde. Eine Liste unter jedem Server-Namen enthält die Verbindungen, die auf dem Server gespeichert sind, auf den Sie Zugriff haben.
Wählen Sie + Server aus, um eine weitere Alteryx Server-Verbindung hinzuzufügen.
Geben Sie im Dateiauswahl-Fenster einen Platzhalter im Dateipfad an.
Nehmen wir einen Fall an, in dem Sie über mehrere Datendateien verfügen, die wie folgt aufgebaut sind:
Die gleiche Anzahl von Feldern, wobei die Datentypen für jedes Feld identisch sind.
Ähnliche Namen im selben Verzeichnis
Anmerkung
Mehrere Dateien werden mit dem Platzhalterformat wie *.csv oder 2019*.csv mit einem einzigen Eingabedaten-Tool gelesen, solange die Dateien alle die gleiche Anzahl an Feldern enthalten und die Datentypen für jedes Feld die gleichen sind. Der Designer legt die Anzahl der Felder und die Dateitypen auf der Grundlage der zuerst gelesenen Datei fest. Alle nachfolgenden Dateien, die nicht übereinstimmen, werden übersprungen, und es wird eine Warnung angezeigt. Es ist nicht möglich festzulegen, welche Datei zuerst gelesen wird, wenn eine Platzhaltersyntax wie *.csv verwendet wird. Das System bestimmt, welche Datei als die erste bezeichnet wird.
Geben Sie den Dateinamen ein, den mehrere Dateien gemeinsam haben, und fügen Sie ein * (Sternchen) ein, um alle nachfolgenden Zeichen zu ersetzen, oder ein ?, um ein Zeichen zu ersetzen. Geben Sie die Dateierweiterung an, die allen Dateien gemeinsam ist, wenn Sie die Dateinamen angeben.
1. Beispiel
Dieser Pfad bezieht jede CSV-Datei in dem
data\datafiles
-Verzeichnis mit einem Dateinamen, der mit
ABCD
beginnt.
Daten\Datendateien\ABCD*.csv
Er liest
ABCD_4.csv
und
ABCD_012.csv
ein.
2. Beispiel
Dieser Pfad liest alle CSV-Dateien im Verzeichnis
Daten\Datendateien
ein, deren Dateinamen mit
ABCD_
beginnen und über ein zusätzliches Zeichen verfügen.
data\datafiles\ABCD_?.csv
Wählen Sie unter Excel-Eingabe auswählen eine der Excel-Eingaben aus:
Ein Blatt auswählen : Ein Blatt kann aus den in der Excel-Datei verfügbaren Blättern ausgesucht werden.
Bereich auswählen (Zellen, Zeilen oder Spalten) : Ermöglicht optionale Auswahl eines Bereichs von Zellen, Zeilen oder Spalten innerhalb des Blatts.
Einen benannten Bereich auswählen : Ermöglicht Auswahl benannter Bereiche, die in der Excel-Datei verfügbar sind.
Importieren Sie nur die Liste der Arbeitsblattnamen , um eine Ausgabe mit einer einzelnen Spalte mit den Arbeitsblattnamen als Werten zu erstellen. Wenn diese Option ausgewählt ist, werden keine der zugehörigen Daten ausgegeben.
Wenn das ausgewählte Excel-Blatt geöffnet ist, wird eine Fehlermeldung angezeigt, und Sie können nicht fortfahren. Schließen Sie das Blatt. Wählen Sie die Aktualisieren -Schaltfläche im Dialogfeld Excel-Eingabe auswählen und beenden Sie den Eingabeprozess.
Das Eingabedaten-Tool überspringt Spalten, die nicht definiert sind. Eine definierte Spalte ist eine Spalte, die entweder Daten enthält oder zuvor Daten enthielt, die vom Benutzer gelöscht wurden. Um Spalten einzubeziehen, die nicht definiert sind, geben Sie einen Bereich über die Option Bereich auswählen (Zellen, Zeilen oder Spalten) im Dialogfeld Excel-Eingabe auswählen an.
Siehe GZIP-Dateiunterstützung und ZIP-Datei-Unterstützung für weitere Informationen.
Wenn Sie eine GZ-, TGZ- oder ZIP-Datei auswählen, wird das Fenster Zu extrahierenden Dateityp auswählen angezeigt. Nutzen Sie die Dropdown-Liste, um den zu verwendenden Dateityp auszuwählen.
Dateien auswählen : Aktivieren Sie das Kontrollkästchen neben der Datei, die Sie extrahieren möchten.
Um alle in der GZIP- oder ZIP-Datei enthaltenen Dateien anzuzeigen, einschließlich der nicht von Alteryx unterstützten Dateien, wählen Sie Andere Dateien unter Zu extrahierenden Dateityp auswählen aus. Wählen Sie einen Dateityp unter Andere Dateien analysieren als aus.
Wichtig
Alteryx unterstützt keine GZIP- und ZIP-Dateien in der Gallery.
CYDB | |
YXDB | |
Alteryx Spatial Zip | SZ |
AVRO | |
Comma Separated Values | CSV |
dBase | DBF |
ESRI Personal GeoDatabase | MDB |
ESRI Shapefile | SHP |
Extensible Markup Language | XML |
FLAT | |
GIS | GRC, GRD |
Google Earth/Google Maps | KML |
GZ, TGZ | |
IBM SPSS | SAV |
JSON | |
MapInfo Professional Interchange Format | MIF |
MapInfo Professional Table | TAB |
Microsoft Access 2000-2003 | MDB |
Microsoft Access 2007, 2010, 2013, 2016 | ACCDB |
Microsoft Excel Binary | XLSB |
Microsoft Excel 1997-2003 | XLS |
XLSX | |
Microsoft Excel Macro-Enabled | XLSM |
QlikView | QVX |
SAS | SAS7BDAT |
SQLite | SQLite |
SRC Geography | GEO |
Text | TXT, ASC |
ZIP |
Zu den unbekannten Dateitypen gehören alle anderen Dateitypen, die Alteryx nicht standardmäßig lesen kann. Wenn Sie ein Eingabedaten-Tool zum Lesen eines unbekannten Dateityps verwenden, wird das Dateityp-auflösen-Fenster mit diesen Optionen angezeigt:
Als integrierten Typ lesen: Wählen Sie den Dateityp aus, der der Struktur Ihrer Datei ähnelt.
Als Textdatei mit fester Breite lesen: Wenn Sie diese Option auswählen, können Sie Spalten mithilfe eines gleitenden Lineals zuweisen. Weitere Informationen zu dieser Option finden Sie unter Flatfile-Layout .
Als durch Trennzeichen getrennte Textdatei lesen: Wählen Sie diese Option aus, wenn ein einzelnes Trennzeichen vorhanden ist, das Spaltenumbrüche in Ihren Daten angibt. Wählen Sie einen geeigneten Trennzeichentyp aus und aktivieren Sie optional die Option Erste Zeile enthält Feldnamen.
Optionen
Dateiformatoptionen auswählen Die Optionen variieren je nach Datei oder Datenbank, mit der Sie eine Verbindung herstellen. Weitere Informationen finden Sie unter Dateiformatoptionen .
Vorschau des Daten-Layouts
Zeigen Sie eine Vorschau auf das Datenlayout im Vorschau fenster an. Die Vorschau des Daten-Layouts ist auf 100 Datensätze beschränkt, bei großen Dateien sogar auf noch weniger. Wenn die Daten 1500 Spalten enthalten, werden mindestens ein Datensatz und bis zu zwei Zeilen angezeigt. Um alle Daten anzuzeigen, verwenden Sie ein Durchsuchen-Tool .
Doppelte Spaltennamen
Wenn Ihre Eingabedatei mehrere Spalten mit demselben Namen enthält, benennt Designer die doppelten Spalten automatisch entsprechend den folgenden Regeln um:
Der doppelte Name endet mit der Ziffer 1 oder 9.
Wenn das letzte Zeichen im doppelten Spaltennamen 1 oder 9 ist, fügt Designer einen Unterstrich (_) und eine Zahl an den doppelten Spaltennamen an, beginnend mit 2.
Original-Spaltenname | Doppelte Spalte (von Designer umbenannt) |
---|---|
A1 | A1_2 |
A9 | A9_2 |
Der doppelte Name endet mit einer Ziffer zwischen 2 und 8 (inklusive).
Wenn das letzte Zeichen in der doppelten Spalte eine Ziffer zwischen 2 und 8 (inklusive) ist, erhöht Designer diese Ziffer, um den doppelten Spaltennamen umzubenennen.
Wenn aber das vorletzte Zeichen auch eine Ziffer ist, fügt Designer einen Unterstrich (_) und eine Zahl an den doppelten Spaltennamen an, beginnend mit 2.
Original-Spaltenname | Doppelte Spalte (von Designer umbenannt) |
---|---|
A2 | A3 |
A5 | A6 |
A22 | A22_2 |
Der doppelte Name endet mit einem Buchstaben oder Sonderzeichen.
Wenn das letzte Zeichen in der doppelten Spalte ein Buchstabe oder ein Sonderzeichen ist, fügt Designer eine Zahl (beginnend mit 2) hinzu, um den doppelten Spaltennamen umzubenennen.
Original-Spaltenname | Doppelte Spalte (von Designer umbenannt) |
---|---|
age | age2 |
registered? | registered?2 |
Anmerkung
In Visual Query Builder können Zeichen aus mehreren Bytes nicht korrekt angezeigt werden. Benutzen Sie stattdessen die Registerkarte „Tabellen“.
Ein Ausgabedaten-Tool in ein Eingabedaten-Tool konvertieren
Sie können ein Datenausgabe-Tool in ein Eingabedaten-Tool konvertieren.
Klicken Sie mit der rechten Maustaste auf das Datenausgabe-Tool , das Sie in ein Eingabedaten-Tool konvertieren möchten.
Wählen Sie In Eingabedaten umwandeln .
Die Ausgabedaten werden zu Eingabedaten.