Skip to main content

Vorbereitung

Bereiten Sie Daten für die nachgeschaltete Analyse vor.

Element

Beschreibung

Automatische-Spalte-Tool

Verwenden Sie das Auto-Spaltentypbestimmung-Tool, um den Spaltentyp und die Spaltengröße für eine effiziente Speicherung von Zeichenfolgendaten automatisch zu ändern.

Stichprobenerstellung-ToolStichprobenerstellung-Tool

Nutzen Sie das Stichprobenerstellung-Tool, um die Eingabedatensätze in zwei oder drei Zufallsstichproben aufzuteilen.

Datenbereinigung-Pro-Tool

Verwenden Sie das Datenbereinigung-Pro-Tool, um häufig auftretende Probleme mit der Datenqualität zu beheben. Sie können Nullwerte ersetzen, Interpunktion und HTML-Tags entfernen, Groß- und Kleinschreibung ändern und vieles mehr.

Datenbereinigung-ToolDatenbereinigung-Tool

Verwenden Sie das Datenbereinigung-Tool, um häufig auftretende Probleme mit der Datenqualität zu beheben. Sie können Nullwerte ersetzen, Interpunktion entfernen, Groß- und Kleinschreibung ändern und vieles mehr.

Filter-ToolFilter-Tool

Verwenden Sie das Filter-Tool, um Daten anhand einer Bedingung auszuwählen.

Formel-ToolFormel-Tool

Verwenden Sie das Formel-Tool, um neue Spalten zu erstellen, Spalten zu aktualisieren und einen oder mehrere Ausdrücke zu verwenden, um eine Vielzahl von Berechnungen und Operationen durchzuführen.

Zeilen-generieren-Tool

Verwenden Sie das Zeilen-generieren-Tool, um neue Datenzeilen mit einem Ausdruck zu erstellen.

Imputation Tool Imputation Tool

Verwenden Sie das Imputation-Tool, um fehlende Werte in Ihren Daten zu bereinigen.

Multi-Column Binning Tool Multi-Column Binning Tool

Verwenden Sie das Mehrfachspalten-Binning-Tool, um für mehrere Spalten einen Kachel- oder Binning-Vorgang auszuführen.

Mehrspaltige-Formel-ToolMehrspaltige-Formel-Tool

Verwenden Sie das Mehrspaltige-Formel-Tool, um mehrere Spalten mit einem einzelnen Ausdruck zu erstellen oder zu aktualisieren.

Multi-Row Formula Tool

Verwenden Sie das Mehrzeilige-Formel-Tool, um Spalten zu erstellen und zu aktualisieren, indem Sie Zeilendaten zum Erstellen von Formeln verwenden.

Oversample Column Tool Oversample Column Tool

Verwenden Sie das Oversample-Spalte-Tool, um automatisch ausgeglichene Stichproben aus unausgeglichenen Daten zur Verwendung in der statistischen Modellierung zu erstellen.

Zufällige-Stichprobe-(%)-ToolZufällige-Stichprobe-(%)-Tool

Nutzen Sie das Zufällige-Stichprobe-(%)-Tool, um eine erwartete Anzahl von Zeilen auszugeben, die aus einer Zufallsstichprobe aus dem eingehenden Datenstrom resultiert.

Ranking-Tool

Verwenden Sie das Ranking-Tool, um Ihre Daten für die weitere Verarbeitung oder Ausgabe in einer Reihenfolge anzuordnen.

Zeilen-ID-ToolZeilen-ID-Tool

Verwenden Sie das Zeilen-ID-Tool, um eine neue Spalte in den Daten zu erstellen und eine eindeutige ID-Nummer zuzuweisen. Diese wird in der Reihenfolge der Zeilen in den Daten erhöht.

Stichproben-ToolStichproben-Tool

Verwenden Sie das Stichproben-Tool, um den Datenstrom auf eine spezifische Anzahl, einen Prozentsatz oder einen zufälligen Satz von Zeilen zu beschränken. Darüber hinaus wendet das Stichproben-Tool die gewählte Konfiguration auf die ausgewählten Spalten an, nach denen gruppiert werden soll.

Datenfelder-auswählen-ToolDatenfelder-auswählen-Tool

Verwenden Sie das Datenfelder-auswählen-Tool, um die Datenspalten, die einen Workflow durchlaufen, auszuwählen, abzuwählen und neu anzuordnen.

Zeilen-auswählen-ToolZeilen-auswählen-Tool

Verwenden Sie das Zeilen-zählen-Tool, um angegebene Zeilen und Zeilenbereiche zurückzugeben, einschließlich nicht fortlaufender Zeilen. Das Tool ist hilfreich für die Fehlerbehandlung und Stichproben.

Daten-sortieren-ToolDaten-sortieren-Tool

Verwenden Sie das Daten-sortieren-Tool, um die Zeilen in einer Tabelle in alphanumerischer Reihenfolge auf Grundlage der Werte der angegebenen Datenfelder anzuordnen.

Kachel-ToolKachel-Tool

Verwenden Sie das Kachel-Tool, um einen Wert (Kachel) auf Grundlage von Bereichen in den Daten zuzuweisen. Das Tool führt dies auf Grundlage einer vom Benutzer aus drei verfügbaren Methoden ausgewählten Methode durch.

Einmalig-ToolEinmalig-Tool

Verwenden Sie das Einmalig-Tool, um zu unterscheiden, ob eine Zeile einmalig oder ein Duplikat ist, indem Sie nach einer oder mehreren angegebenen Spalten gruppieren und dann nach diesen Spalten sortieren.