Skip to main content

Vorbereitung

Bereiten Sie Daten für die nachgeschaltete Analyse vor.

Element

Beschreibung

Nutzen Sie das Stichprobenerstellung-Tool, um die Eingabedatensätze in zwei oder drei Zufallsstichproben aufzuteilen.

Datenbereinigung-Tool

Verwenden Sie das Datenbereinigung-Tool, um häufig auftretende Probleme mit der Datenqualität zu beheben. Sie können Nullwerte ersetzen, Interpunktion entfernen, Groß- und Kleinschreibung ändern und vieles mehr.

Filter-Tool

Verwenden Sie das Filter-Tool, um Daten anhand einer Bedingung auszuwählen.

Formel-Tool

Verwenden Sie das Formel-Tool, um neue Spalten zu erstellen, Spalten zu aktualisieren und einen oder mehrere Ausdrücke zu verwenden, um eine Vielzahl von Berechnungen und Operationen durchzuführen.

Mehrspaltige-Formel-Tool

Verwenden Sie das Mehrspaltige-Formel-Tool, um mehrere Spalten mit einem einzelnen Ausdruck zu erstellen oder zu aktualisieren.

Zufällige-Stichprobe-(%)-Tool

Nutzen Sie das Zufällige-Stichprobe-(%)-Tool, um eine erwartete Anzahl von Zeilen auszugeben, die aus einer Zufallsstichprobe aus dem eingehenden Datenstrom resultiert.

Zeilen-ID-Tool

Verwenden Sie das Zeilen-ID-Tool, um eine neue Spalte in den Daten zu erstellen und eine eindeutige ID-Nummer zuzuweisen. Diese wird in der Reihenfolge der Zeilen in den Daten erhöht.

Stichproben-Tool

Verwenden Sie das Stichproben-Tool, um den Datenstrom auf eine spezifische Anzahl, einen Prozentsatz oder einen zufälligen Satz von Zeilen zu beschränken. Darüber hinaus wendet das Stichproben-Tool die gewählte Konfiguration auf die ausgewählten Spalten an, nach denen gruppiert werden soll.

Datenfelder-auswählen-Tool

Verwenden Sie das Datenfelder-auswählen-Tool, um die Datenspalten, die einen Workflow durchlaufen, auszuwählen, abzuwählen und neu anzuordnen.

Zeilen-auswählen-Tool

Verwenden Sie das Zeilen-zählen-Tool, um angegebene Zeilen und Zeilenbereiche zurückzugeben, einschließlich nicht fortlaufender Zeilen. Das Tool ist hilfreich für die Fehlerbehandlung und Stichproben.

Daten-sortieren-Tool

Verwenden Sie das Daten-sortieren-Tool, um die Zeilen in einer Tabelle in alphanumerischer Reihenfolge auf Grundlage der Werte der angegebenen Datenfelder anzuordnen.

Kachel-Tool

Verwenden Sie das Kachel-Tool, um einen Wert (Kachel) auf Grundlage von Bereichen in den Daten zuzuweisen. Das Tool führt dies auf Grundlage einer vom Benutzer aus drei verfügbaren Methoden ausgewählten Methode durch.

Verwenden Sie das Einmalig-Tool, um zu unterscheiden, ob eine Zeile einmalig oder ein Duplikat ist, indem Sie nach einer oder mehreren angegebenen Spalten gruppieren und dann nach diesen Spalten sortieren.