Vorbereitung
Stellen Sie den Feldtyp auf die kleinstmögliche Größe relativ zu den in der Spalte enthaltenen Daten ein.
Teilen Sie die Eingabedatensätze in zwei oder drei Zufallsstichproben auf.
Beheben Sie häufige Datenqualitätsprobleme einschließlich Nullen und unerwünschter Zeichen. Groß- und Kleinschreibung ändern
Verwenden Sie das Filter-Tool, um Daten über eine Bedingung auszuwählen. Datenzeilen, die die Bedingung erfüllen, werden über den True-Anker ausgegeben.
Das Formel-Tool verwendet Ausdrücke zum Erstellen und Aktualisieren von Spalten.
Mit dem Zeilen-generieren-Tool werden neue Datenzeilen auf Datensatzebene erzeugt.
Das Imputation-Tool ermöglicht es dem Benutzer, Werte in numerischen Datenfeldern zu ersetzen.
Mit diesem Tool kann ein Benutzer für mehrere Felder einen Kachel- oder Binning-Vorgang ausführen.
Das Berechnetes-Feld-(mehrere)-Tool erstellt oder aktualisiert mehrere Felder mit einem einzigen Ausdruck.
Dieses Tool verwendet Ausdrücke zum Erstellen und Aktualisieren von Spalten mithilfe von Zeilendaten zum Erstellen von Formeln.
Dieses Tool ermöglicht es, Daten mit hohem Anteil an negativen Antworten zu normalisieren.
Gibt eine zufällige Stichprobe des eingehenden Datenstroms zurück.
Verwenden Sie das Datensatz-ID-Tool, um eine neue Spalte in den Daten zu erstellen und eine eindeutige ID-Nummer zuzuweisen. Diese wird in der Reihenfolge der Datensätze in den Daten erhöht.
Dieses Tool beschränkt den Datenstrom auf eine spezifische Anzahl, einen Prozentsatz oder einen zufälligen Satz von Zeilen.
Dieses Tool gibt Datensätze und Datensatzbereiche zurück, die angegeben wurden,
Mit dem Datenfelder-auswählen-Tool können Sie die Datenspalten, die einen Workflow durchlaufen, auswählen, abwählen und neu anordnen.
Verwenden Sie das Daten-sortieren-Tool, um die Datensätze in einer Tabelle in alphanumerischer Reihenfolge auf der Basis der Werte der angegebenen Datenfelder anzuordnen.
Dieses Tool verwendet benutzerdefinierte Methoden, um einen Wert (Kachel) auf Basis von Bereichen in den Daten zuzuweisen.
Dieses Tool unterscheidet, ob ein Datensatz eindeutig oder ein Duplikat basierend auf spezifizierten Feldern ist.