Skip to main content

Datenbereinigung-Tool

Verwenden Sie das Datenbereinigung-Tool, um häufig auftretende Probleme mit der Datenqualität zu beheben. Sie können Nullwerte ersetzen, Interpunktion entfernen, Groß- und Kleinschreibung ändern und vieles mehr.

Bekannte Einschränkungen

Zahlen mit mehr als 15 Ziffern müssen als Zeichenfolgen behandelt werden, oder sie verlieren an Genauigkeit. Legen Sie den Spaltentyp mit dem Datenfelder-auswählen-Tool auf eine Zeichenfolge fest.

Tool-Komponenten

data-cleansing-with-anchors.png

Abbildung: Datenbereinigung-Tool mit Ankern.

Das Datenbereinigung-Tool verfügt über zwei Anker.

  • Eingabeanker: Verwenden Sie den Eingabeanker, um die Daten zu verbinden, die Sie bereinigen möchten.

  • Ausgabeanker: Der Ausgabeanker gibt die bereinigten Daten aus.

Tool-Konfiguration

Nulldaten entfernen

Verwenden Sie diese Optionen, um ganze Zeilen und Spalten mit Nulldaten zu entfernen:

  • Nullzeilen entfernen

    • Entfernt alle Zeilen mit einem Nullwert in jeder Spalte.

    • Zeilen mit Nullwerten entfernen – entfernt keine Zeilen mit leeren Zeichenfolgenwerten.

    • Entfernt nur Zeilen, die in jeder Spalte einen Nullwert haben.

Zu bereinigende Spalten auswählen

Wählen Sie die zu bereinigenden Spalten aus. Aktivieren Sie Alle auswählen, um alle Spalten auszuwählen bzw. die Auswahl aufzuheben.

Zeichenfolgen-Datentypen

Alle Optionen, ausgenommen Nullwerte durch 0 ersetzen, gelten für Zeichenfolgen-Datentypen. Verwenden Sie mehrere Datenbereinigung-Tools in Ihrem Workflow, um verschiedene Optionen für verschiedene Spalten anzugeben.

Nullen ersetzen

  • Durch Leerzeichen ersetzen (Zeichenfolgenspalten): Ersetzen Sie Nullwerte durch einen leeren Zeichenfolgenwert. Ein Leerzeichen wird als " " und nicht als [Null] erfasst. Diese Option ist standardmäßig ausgewählt.

  • Durch 0 ersetzen (Numerische Spalten): Ersetzen Sie Nullwerte durch eine 0 (Null). Diese Option ist standardmäßig ausgewählt.

Unerwünschte Zeichen entfernen

  • Führende und nachfolgende Leerzeichen: Entfernt führende und nachfolgende Leerzeichen. Diese Option ist standardmäßig ausgewählt.

  • Tabulatoren, Zeilenumbrüche und doppelte Leerzeichen: Ersetzt das Auftreten von Leerzeichen durch ein einzelnes Leerzeichen, einschließlich Zeilenenden, Tabulatoren, mehreren Leerzeichen und anderen aufeinanderfolgenden Leerzeichen.

  • Alle Leerzeichen: Entfernt alle Leerzeichen.

  • Buchstaben: Entfernt alle Buchstaben, einschließlich der Buchstaben, die nicht zum lateinischen Alphabet gehören, z. B. A b Z À é ö.

  • Zahlen: Entfernt alle Zahlen.

  • Interpunktion: Entfernt diese Zeichen: ! " # $ % & ' ( ) * + , \ - . / : ; < = > ? @ [ / ] ^ _ ` { | } ~

Groß- und Kleinschreibung ändern

Wählen Sie Groß- und Kleinschreibung ändern aus und dann eine Option aus dem Auswahlmenü, um die Großschreibung von Zeichenfolgen-Datentypen zu ändern:

  • Großbuchstaben: Alle Buchstaben in einer Zeichenfolge werden großgeschrieben.

  • Kleinbuchstaben: Konvertiert alle Buchstaben in einer Zeichenfolge in Kleinbuchstaben.

  • Große Anfangsbuchstaben: Die ersten Buchstaben aller Wörter in einer Zeichenfolge werden großgeschrieben.