Datenqualität
Mit dem Datenqualität-Tool können Sie den Qualitätsstatus Ihrer Daten überprüfen. Sie können das Tool mit den Feature-Engineering-Tools wie Feature-Typen und Features-erstellen verwenden, um den Qualitätsstatus Ihrer Daten zu verbessern. Das Tool analysiert fehlende Werte, Ausreißer und Datendichte, um den Qualitätsstatus Ihrer Daten zu ermitteln.
Alteryx Intelligence Suite - Überblick
Dieses Tool ist Teil der Alteryx Intelligence Suite . Alteryx Intelligence Suite erfordert eine separate Lizenz und ein Add-on-Installationsprogramm für Designer. Nachdem Sie Designer installiert haben, installieren Sie Intelligence Suite und starten Sie Ihre kostenlose Testversion .
Tool-Komponenten
Das Datenqualität-Tool verfügt über vier Anker.
Eingabeanker: Der Eingabeanker stellt eine Verbindung zu den Daten her, deren Qualitätsstatus Sie überprüfen möchten.
S -Ausgabeanker: Der S -Ausgabeanker übergibt die zugeordneten Datenqualitätsbewertungen jeder Spalte nachgeschaltet weiter.
R -Ausgabeanker: Der R -Ausgabeanker übergibt einen vollständigen Bericht über den Qualitätsstatus der Daten nachgeschaltet weiter. Sie können den Bericht mit einem Durchsuchen-Tool anzeigen.
O -Ausgabeanker: Der O -Ausgabeanker übergibt die Ausreißer (Outliers) aus dem Datenbestand nachgeschaltet weiter.
Tool-Konfiguration
Zur Verwendung des Datenqualität-Tools müssen Sie festlegen, welche Skala für die Bewertung der Datenqualität verwendet werden soll und ob Empfehlungen zur Verbesserung der Datenqualität in die Ausgabe aufgenommen werden sollen.
Wichtig
Damit dieses Tool verwendet werden kann, müssen die vorgeschalteten Daten mindestens 30 Zeilen enthalten.
1. Skala
Wählen Sie in der Dropdown-Liste aus, ob Sie die Werte auf einer prozentualen Skala (0 - 100 %) oder auf einer normalisierten Skala (0-1) ausgeben möchten. Das Tool generiert die Bewertung, indem es fehlende Werte, Ausreißer und die Datendichte auswertet.
2. Empfehlungen auf Basis der Bewertung ausgeben
Aktivieren Sie das Kontrollkästchen, wenn Sie möchten, dass das Tool Ihnen Empfehlungen zur Verbesserung der Datenqualität auf Basis der erlangten Bewertung (Score) gibt. Die Empfehlung (Recommended Action) wird als zusätzliche Spalte im Dataset angezeigt.