Vorbereitung
Bereiten Sie Daten für die nachgeschaltete Analyse vor.
Element | Beschreibung |
|---|---|
Nutzen Sie das Stichprobenerstellung-Tool, um die Eingabedatensätze in zwei oder drei Zufallsstichproben aufzuteilen. | |
Verwenden Sie das Datenbereinigung-Tool, um häufig auftretende Probleme mit der Datenqualität zu beheben. Sie können Nullwerte ersetzen, Interpunktion entfernen, Groß- und Kleinschreibung ändern und vieles mehr. | |
Verwenden Sie das Filter-Tool, um Daten anhand einer Bedingung auszuwählen. | |
Verwenden Sie das Formel-Tool, um neue Spalten zu erstellen, Spalten zu aktualisieren und einen oder mehrere Ausdrücke zu verwenden, um eine Vielzahl von Berechnungen und Operationen durchzuführen. | |
Verwenden Sie das Imputation-Tool, um fehlende Werte in Ihren Daten zu bereinigen. | |
Verwenden Sie das Mehrfachspalten-Binning-Tool, um für mehrere Spalten einen Kachel- oder Binning-Vorgang auszuführen. | |
Verwenden Sie das Mehrspaltige-Formel-Tool, um mehrere Spalten mit einem einzelnen Ausdruck zu erstellen oder zu aktualisieren. | |
Verwenden Sie das Oversample-Spalte-Tool, um automatisch ausgeglichene Stichproben aus unausgeglichenen Daten zur Verwendung in der statistischen Modellierung zu erstellen. | |
Nutzen Sie das Zufällige-Stichprobe-(%)-Tool, um eine erwartete Anzahl von Zeilen auszugeben, die aus einer Zufallsstichprobe aus dem eingehenden Datenstrom resultiert. | |
Verwenden Sie das Zeilen-ID-Tool, um eine neue Spalte in den Daten zu erstellen und eine eindeutige ID-Nummer zuzuweisen. Diese wird in der Reihenfolge der Zeilen in den Daten erhöht. | |
Verwenden Sie das Stichproben-Tool, um den Datenstrom auf eine spezifische Anzahl, einen Prozentsatz oder einen zufälligen Satz von Zeilen zu beschränken. Darüber hinaus wendet das Stichproben-Tool die gewählte Konfiguration auf die ausgewählten Spalten an, nach denen gruppiert werden soll. | |
Verwenden Sie das Datenfelder-auswählen-Tool, um die Datenspalten, die einen Workflow durchlaufen, auszuwählen, abzuwählen und neu anzuordnen. | |
Verwenden Sie das Zeilen-zählen-Tool, um angegebene Zeilen und Zeilenbereiche zurückzugeben, einschließlich nicht fortlaufender Zeilen. Das Tool ist hilfreich für die Fehlerbehandlung und Stichproben. | |
Verwenden Sie das Daten-sortieren-Tool, um die Zeilen in einer Tabelle in alphanumerischer Reihenfolge auf Grundlage der Werte der angegebenen Datenfelder anzuordnen. | |
Verwenden Sie das Kachel-Tool, um einen Wert (Kachel) auf Grundlage von Bereichen in den Daten zuzuweisen. Das Tool führt dies auf Grundlage einer vom Benutzer aus drei verfügbaren Methoden ausgewählten Methode durch. | |
Verwenden Sie das Einmalig-Tool, um zu unterscheiden, ob eine Zeile einmalig oder ein Duplikat ist, indem Sie nach einer oder mehreren angegebenen Spalten gruppieren und dann nach diesen Spalten sortieren. |