Alteryx-Datenbankdateiformat

Bei dem Alteryx Datenbankdateiformat YXDB handelt es sich um einen Dateityp, der Datenfelder, Werte und Geo-Objekte beinhalten kann. Das YXDB-Format ist der effizienteste Dateityp zum Lesen und Schreiben in Alteryx, da er keine Größenbeschränkung hat, für maximale Geschwindigkeit komprimiert ist und zusätzliche Metadaten enthält, die auf die Quelle der Daten und die Art der Datenerstellung verweisen. Es gibt zwar keine Begrenzung in der Anzahl der Zeilen oder der Dateigröße, doch in 64-Bit-Umgebungen beträgt die Größenbeschränkung 2 GB pro einzelne Zelle. Alle Alteryx-Produkte haben Lese- und Schreibunterstützung für YXDB-Dateien.

Weshalb ist YXDB der effizienteste Eingabe-/Ausgabedateityp?

YXDB-Dateien verwenden genau dieselben Spaltentypen, Strukturen und Formate wie Alteryx intern, daher funktioniert dieser Dateityp am besten mit dem Programm. Die Anzahl der Zeilen ist nicht beschränkt, weshalb mehr als zwei Milliarden Zeilen verarbeitet werden können. Es gibt (abgesehen von Text) kein anderes Dateiformat, das so viele Zeilen unterstützt.

Wird eine YXDB-Datei komprimiert?

Ja, sie sind minimal komprimiert für maximale Geschwindigkeit, jedoch nicht für maximale Komprimierung. Wenn Sie einen Geodatenindex haben, ist die Komprimierung kaum bemerkbar. Ohne Geodatenindex kann die Komprimierung jedoch gelegentlich ziemlich gut sein.

Wenn ich Daten in eine Datei umwandeln möchte, die ein Geo-Objekt enthält, aber nicht mit dem Geo-Objekt interagiere, ist es dann immer noch am effizientesten, eine YXDB zu verwenden?

Ja, doch in diesem Fall sollten Sie den Geodatenindex in den erweiterten Optionen ausschalten, sodass Sie durch dessen Erstellung keine Zeit und keinen Speicherplatz verschwenden.

Welche anderen Informationen sind in einer YXDB-Datei gespeichert?

Wenn Alteryx in eine YXDB-Datei schreibt, werden die Daten in den Spalten Quelle und Beschreibung in der Datei gespeichert, sodass Sie immer wissen, wie eine Spalte erstellt wurde oder welchem Jahrgang die zugrunde liegenden Datenwerte entsprechen. Ein Beispiel dieser Metadaten finden Sie im Feldinformationen-Tool .

Quelle : Enthält das Tool, die Datei oder den Prozess, aus dem/der das Feld stammt. Es können auch weitere Metainformationen wie ein spezifisches Dataset aus einem Plug-in enthalten sein. Zu den Tools, die Metainformationen melden, gehören: Allocate-Eingabe-Tool und Allocate-Anhang-Tool , CASS-Tool , Formel-Tool , Straßen-Geocoder-Tool sowie Tools, die Fahrzeiten berechnen, wie das Handelsbereich-Tool , Entfernung-Tool und Nächstgelegener-Punkt-Tool .
Beschreibung : Kann, muss aber nicht Informationen enthalten. Werden Daten aus einem Allocate-Tool angehängt, enthält dieses Feld den längeren, besser beschreibenden Feldnamen. Der Benutzer kann auch eigene Feldbeschreibungen über das Datenfelder-auswählen-Tool hinzufügen. Diese Informationen bleiben mit dem Feld verknüpft.

Anwendungsbeispiel

Problem

Ich habe zwei SQL-Abfragen und einige Workflows, bei denen das zweite Dataset gleich bleibt und drei Millionen Datensätze enthält. Gibt es eine Möglichkeit, das zweite Dataset im selben Workflow oder in anderen Workflows wiederzuverwenden, damit die SELECT-Anweisung nicht immer wieder ausgeführt werden muss?

Lösung

Wenn Sie Daten in Ihrem Workflow zwischenspeichern müssen, verwenden Sie ein Datenausgabe-Tool und schreiben Sie in das YXDB-Format. Sie können Ihren ersten Workflow in die YXDB-Datei schreiben lassen, in der alle Daten aus Ihrer Abfrage gespeichert werden. Verwenden Sie dann diese YXDB-Daten als Eingabedaten für Ihre anderen Workflows. Auf diese Weise können Sie das statische Dataset für die Entwicklung bearbeiten. Wenn Sie den Workflow jemals auf eine Live-Datenverbindung umschalten möchten, können Sie einfach das Eingabedaten-Tool aus dem anderen Workflow kopieren.

Wenn Sie Daten nur innerhalb eines Workflows wiederverwenden müssen, ziehen Sie die Funktion Workflow zwischenspeichern und ausführen in Betracht.

In diesem Abschnitt: