Datenbereinigung-Tool
Verwenden Sie das Datenbereinigung-Tool, um häufig auftretende Probleme mit der Datenqualität zu beheben. Sie können Nullwerte ersetzen, Interpunktion entfernen, Groß- und Kleinschreibung ändern und vieles mehr.
Bekannte Einschränkungen
Zahlen mit mehr als 15 Ziffern müssen als Zeichenfolgen behandelt werden, oder sie verlieren an Genauigkeit. Legen Sie den Spaltentyp mit dem Datenfelder-auswählen-Tool auf eine Zeichenfolge fest.
Tool-Komponenten
![]() |
Abbildung: Datenbereinigung-Tool mit Ankern.
Das Datenbereinigung-Tool verfügt über zwei Anker.
Eingabeanker: Verwenden Sie den Eingabeanker, um die Daten zu verbinden, die Sie bereinigen möchten.
Ausgabeanker: Der Ausgabeanker gibt die bereinigten Daten aus.
Tool-Konfiguration
Nulldaten entfernen
Verwenden Sie diese Optionen, um ganze Zeilen und Spalten mit Nulldaten zu entfernen:
Nullzeilen entfernen
Entfernt alle Zeilen mit einem Nullwert in jeder Spalte.
Zeilen mit Nullwerten entfernen – entfernt keine Zeilen mit leeren Zeichenfolgenwerten.
Entfernt nur Zeilen, die in jeder Spalte einen Nullwert haben.
Zu bereinigende Spalten auswählen
Wählen Sie die zu bereinigenden Spalten aus. Aktivieren Sie Alle auswählen, um alle Spalten auszuwählen bzw. die Auswahl aufzuheben.
Zeichenfolgen-Datentypen
Alle Optionen, ausgenommen Nullwerte durch 0 ersetzen, gelten für Zeichenfolgen-Datentypen. Verwenden Sie mehrere Datenbereinigung-Tools in Ihrem Workflow, um verschiedene Optionen für verschiedene Spalten anzugeben.
Nullen ersetzen
Durch Leerzeichen ersetzen (Zeichenfolgenspalten): Ersetzen Sie Nullwerte durch einen leeren Zeichenfolgenwert. Ein Leerzeichen wird als
" "und nicht als[Null]erfasst. Diese Option ist standardmäßig ausgewählt.Durch 0 ersetzen (Numerische Spalten): Ersetzen Sie Nullwerte durch eine
0(Null). Diese Option ist standardmäßig ausgewählt.
Unerwünschte Zeichen entfernen
Führende und nachfolgende Leerzeichen: Entfernt führende und nachfolgende Leerzeichen. Diese Option ist standardmäßig ausgewählt.
Tabulatoren, Zeilenumbrüche und doppelte Leerzeichen: Ersetzt das Auftreten von Leerzeichen durch ein einzelnes Leerzeichen, einschließlich Zeilenenden, Tabulatoren, mehreren Leerzeichen und anderen aufeinanderfolgenden Leerzeichen.
Alle Leerzeichen: Entfernt alle Leerzeichen.
Buchstaben: Entfernt alle Buchstaben, einschließlich der Buchstaben, die nicht zum lateinischen Alphabet gehören, z. B. A b Z À é ö.
Zahlen: Entfernt alle Zahlen.
Interpunktion: Entfernt diese Zeichen: ! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~
Groß- und Kleinschreibung ändern
Wählen Sie Groß- und Kleinschreibung ändern aus und dann eine Option aus dem Auswahlmenü, um die Großschreibung von Zeichenfolgen-Datentypen zu ändern:
Großbuchstaben: Alle Buchstaben in einer Zeichenfolge werden großgeschrieben.
Kleinbuchstaben: Konvertiert alle Buchstaben in einer Zeichenfolge in Kleinbuchstaben.
Große Anfangsbuchstaben: Die ersten Buchstaben aller Wörter in einer Zeichenfolge werden großgeschrieben.
