
Was fällt unter Datenaufbereitung?
Die Datenaufbereitung ist der Prozess, um mangelhafte oder fehlende Daten in der erforderlichen Qualität für Systeme und Analysen bereitzustellen.
Hierbei geht es um die Datenaufbereitung, die beispielsweise ein Business Analyst durchführt und damit einmalig die Grundlage erschafft, die sonst verschiedene Mitarbeitende und Abteilungen manuell ständig im Tagesgeschäft wiederholen würden.
Die Schritte der Datenaufbereitung umfassen mehrere Phasen, die je nach Bedarf angewendet werden.
Im Folgenden führe ich die wesentlichen Schritte der Datenaufbereitung auf und gehe darauf ein.
Details zu den jeweiligen Schritten werden in weiteren einzelnen Beiträgen beschrieben, um dem jeweiligen Schritt den erforderlichen Raum zu geben und die Tiefe der Datenaufbereitung übersichtlich und nachvollziehbar zu betrachten.
#1 Datenbeschaffung
Die Datenbeschaffung ist der erste Schritt in den verschiedenen Phasen der Datenaufbereitung. Hierbei werden die relevanten Daten aus verschiedenen Quellen zusammengesammelt:
Quellen:
- Excel-Dateien
- System-Datenbanken
- Informationen in Ticketsystemen
- Papierunterlagen
- Visitenkarten
- Handschriftlichen Notizen
- Kontaktlisten aus dem E-Mail-Programm
- Daten durch Befragungen
- Daten durch Zukauf
Das Ziel ist es, einen Pool aller eventuell notwendigen Daten zusammenzutragen.
Es ist hilfreich, verschiedene Ziele der künftigen Datenverwendung im Hinterkopf zu behalten und Ideen zu sammeln.
Beispiele:
- Neuorganisation Reporting/Berichtswesen und umfassendes Kunden-Dashboard mit verschiedenen Ebenen von Kundenkategorisierungen
- Prozessautomatisierung und Nutzung von E-Mail-Adressen für den E-Mail-Versand von E-Rechnungen
- Verwendung von E-Mail-Adressen für neue Anwendungen wie den Start des E-Mail-Marketings
#2 Datenbereinigung
Die Datenbereinigung umfasst das Entfernen von Dubletten, das Korrigieren fehlender Daten oder das Löschen irrelevanter Daten. Dieser Schritt ist entscheidend, um die Qualität der Daten sicherzustellen.
Beispiele:
- Entfernen von doppelten Kundendatensätzen
- Korrigieren von Fehlern (z.B. Tippfehler) in Artikelstammdaten
- Entfernen von unvollständigen oder irrelevanten Datensätzen aus Kundenmemos
#3 Datenstrukturierung
Während der Datenstrukturierung werden die Daten in einem einheitlichen Format organisiert, nebeneinandergestellt oder aneinandergefügt. Datenhierarchien, Zusammenhänge zwischen den Daten sowie Datenmodelle können definiert, identifiziert und hergestellt werden. Dies vereinfacht die weitere Verarbeitung der Daten.
Beispiele:
- Normalisierung von Telefonnummern im internationalen Format
- Erstellen von Datenmodellen zu Kunden, Adressen, Ansprechpartnern
- Definieren von Datenhierarchien wie Kleidung als Überkategorie von Hosen und Oberteilen
#4 Datenanreicherung
Die Datenanreicherung ist das Ergänzen von zusätzlichen Informationen, um den Wert der bestehenden Daten zu erhöhen und sie zu vervollständigen. Dies kann bspw. durch Erfassen neuer Daten durch Befragungen (z.B. Kundenbefragungen), der Abfrage von Daten (z.B. Schreiben an alle Kunden) oder Zukauf von Daten (z.B. Insolvenz-Status bestimmter Unternehmen).
Beispiele:
- Hinzufügen von geografischen Informationen
- Ergänzen von demografischen Daten
- Berechnen von Kennzahlen
#5 Datenumwandlung
Die Datenumwandlung umfasst das Konvertieren der Daten in das benötigte Format für die spätere Zielanwendung. Dies kann das Ändern von Datentypen (z.B. Zahl zu Text, damit die führende „0“ in der PLZ nicht verloren geht), das Zusammenführen von Datensätzen (z.B. Umsatzdetails verschiedener Niederlassungen) oder das Aggregieren (z.B. Kundennamen zur jeweiligen Branche) von Daten beinhalten.
Beispiele:
- Konvertieren von Zahlen in Text um die führende „0“ in Postleitzahlen zu erhalten
- Zusammenführen von Tabellen wie Kontaktlisten mehrerer Vertriebler aus dem E-Mail-Programm
- Aggregieren von Daten nach bestimmten Kriterien wie Kunden nach Vertriebsgebieten
#6 Datenvalidierung
Die Datenvalidierung ist der Schritt, in dem die Daten auf Richtigkeit (z.B. die E-Mail-Adresse enthält ein „@“), Schlüssigkeit (z.B., wenn Kunden Rechnungen per E-Mail erhalten sollen, muss eine E-Mail-Adresse hinterlegt sein) und Vollständigkeit (z.B. die E-Mail-Adresse ist an allen erforderlichen Stellen im System hinterlegt) überprüft werden. Dies stellt sicher, dass die Daten im richtigen Zusammenhang an der richtigen Stelle diverse Anforderungen für alle Verwendungen und Anwendungen erfüllen.
Beispiele:
- Überprüfen, ob die E-Mail-Adresse ein „@“ enthält
- Sicherstellen, dass eine E-Mail-Adresse hinterlegt ist, wenn Kunden Rechnungen per E-Mail erhalten sollen
- Überprüfen, ob die E-Mail-Adresse an allen erforderlichen Stellen im System hinterlegt ist
#7 Datenaktualisierung
Die Datenaktualisierung stellt sicher, dass die Daten auf dem neuesten Stand sind. Dies erfolgt, indem veraltete Informationen (z.B. alte E-Mail-Adressen) ersetzt und Statusinformationen (z.B. Insolvenz-Kennzeichen im ERP-System) angepasst werden.
Beispiele:
- Ersetzen veralteter Informationen wie der Wechsel des Ansprechpartners
- Anpassen von Statusinformationen wie Insolvenzen im Kundenstamm
- Regelmäßige Datenimporte und Synchronisationen von Preisen und Lieferzeiten
#8 Datenvisualisierung
Bei der Datenvisualisierung werden Daten grafisch abgebildet. Das können komprimierte Tabellen, Diagramme, Dashboards, Grafiken, Trendentwicklungen und Kennzahlenübersichten sein. Dies dient dem schnellen Überblick und der einfacheren Interpretation.
Beispiele:
- Komprimierte Tabellen mit verdichteten Daten in tabellarischer Form
- Diagramme wie Balken-, Linien- oder Kreisdiagramme
- Dashboards mit interaktiven Visualisierungen, die mehrere Diagramme und Kennzahlen auf einer Seite zusammenfassen
- Grafiken, die Muster und Trends aufzeigen
- Trendentwicklungen, die Veränderungen über die Zeit zeigen
- Kennzahlenübersichten mit Zusammenfassungen wichtiger Metriken und KPIs
Schlussfolgerung
Was bedeutet der Datenaufbereitungsprozess für Unternehmen?
Die Datenaufbereitung ist ein essenzieller Prozess, um sicherzustellen, dass Daten in der erforderlichen Qualität für Systeme und Analysen bereitgestellt werden.
Die einzelnen Schritte der Datenaufbereitung sind dabei von großer Bedeutung.
Durch die sorgfältige Durchführung der beschriebenen Schritte – von der Datenbeschaffung über die Datenbereinigung und -strukturierung bis hin zur Datenvisualisierung – können Unternehmen sicherstellen, dass ihre Daten zuverlässig, konsistent und nutzbar sind.
Dies bildet die Grundlage für datengestützte Entscheidungen und Prozessautomatisierungen mithilfe bestehender Systeme.
Weiterlesen im anderen Beitrag:
>> Bestandteile des Datenmanagements
Haben Sie Bedarf in einem oder mehreren Bereichen erkannt? Vereinbaren Sie direkt einen Termin für eine unverbindliche Erstanalyse.
100% unverbindlich
Weitere Ressourcen
Weiterlesen:
>> Praxisbeispiel: Prozess der Datenaufbereitung für ERP und CRM in Excel