Schritte der Datenaufbereitung

Inhaltsverzeichnis

Endlich möglichst viele Daten nutzen.

Was fällt unter Datenaufbereitung?

Die Datenaufbereitung ist der Prozess, um mangelhafte oder fehlende Daten in der erforderlichen Qualität für Systeme und Analysen bereitzustellen.

Hierbei geht es um die Datenaufbereitung, die beispielsweise ein Business Analyst durchführt und damit einmalig die Grundlage erschafft, die sonst verschiedene Mitarbeitende und Abteilungen manuell ständig im Tagesgeschäft wiederholen würden.

Die Schritte der Datenaufbereitung umfassen mehrere Phasen, die je nach Bedarf angewendet werden.

Im Folgenden führe ich die wesentlichen Schritte der Datenaufbereitung auf und gehe darauf ein.

Details zu den jeweiligen Schritten werden in weiteren einzelnen Beiträgen beschrieben, um dem jeweiligen Schritt den erforderlichen Raum zu geben und die Tiefe der Datenaufbereitung übersichtlich und nachvollziehbar zu betrachten.

Die Datenbeschaffung ist der erste Schritt in den verschiedenen Phasen der Datenaufbereitung. Hierbei werden die relevanten Daten aus verschiedenen Quellen zusammengesammelt:

Quellen:

  • Excel-Dateien
  • System-Datenbanken
  • Informationen in Ticketsystemen
  • Papierunterlagen
  • Visitenkarten
  • Handschriftlichen Notizen
  • Kontaktlisten aus dem E-Mail-Programm
  • Daten durch Befragungen
  • Daten durch Zukauf

Das Ziel ist es, einen Pool aller eventuell notwendigen Daten zusammenzutragen.

Es ist hilfreich, verschiedene Ziele der künftigen Datenverwendung im Hinterkopf zu behalten und Ideen zu sammeln.

Beispiele:

  • Neuorganisation Reporting/Berichtswesen und umfassendes Kunden-Dashboard mit verschiedenen Ebenen von Kundenkategorisierungen
  • Prozessautomatisierung und Nutzung von E-Mail-Adressen für den E-Mail-Versand von E-Rechnungen
  • Verwendung von E-Mail-Adressen für neue Anwendungen wie den Start des E-Mail-Marketings

Die Datenbereinigung umfasst das Entfernen von Dubletten, das Korrigieren fehlender Daten oder das Löschen irrelevanter Daten. Dieser Schritt ist entscheidend, um die Qualität der Daten sicherzustellen.

Beispiele:

  • Entfernen von doppelten Kundendatensätzen
  • Korrigieren von Fehlern (z.B. Tippfehler) in Artikelstammdaten
  • Entfernen von unvollständigen oder irrelevanten Datensätzen aus Kundenmemos

Während der Datenstrukturierung werden die Daten in einem einheitlichen Format organisiert, nebeneinandergestellt oder aneinandergefügt. Datenhierarchien, Zusammenhänge zwischen den Daten sowie Datenmodelle können definiert, identifiziert und hergestellt werden. Dies vereinfacht die weitere Verarbeitung der Daten.

Beispiele:

  • Normalisierung von Telefonnummern im internationalen Format
  • Erstellen von Datenmodellen zu Kunden, Adressen, Ansprechpartnern
  • Definieren von Datenhierarchien wie Kleidung als Überkategorie von Hosen und Oberteilen

Die Datenanreicherung ist das Ergänzen von zusätzlichen Informationen, um den Wert der bestehenden Daten zu erhöhen und sie zu vervollständigen. Dies kann bspw. durch Erfassen neuer Daten durch Befragungen (z.B. Kundenbefragungen), der Abfrage von Daten (z.B. Schreiben an alle Kunden) oder Zukauf von Daten (z.B. Insolvenz-Status bestimmter Unternehmen).

Beispiele:

  • Hinzufügen von geografischen Informationen
  • Ergänzen von demografischen Daten
  • Berechnen von Kennzahlen

Die Datenumwandlung umfasst das Konvertieren der Daten in das benötigte Format für die spätere Zielanwendung. Dies kann das Ändern von Datentypen (z.B. Zahl zu Text, damit die führende „0“ in der PLZ nicht verloren geht), das Zusammenführen von Datensätzen (z.B. Umsatzdetails verschiedener Niederlassungen) oder das Aggregieren (z.B. Kundennamen zur jeweiligen Branche) von Daten beinhalten.

Beispiele:

  • Konvertieren von Zahlen in Text um die führende „0“ in Postleitzahlen zu erhalten
  • Zusammenführen von Tabellen wie Kontaktlisten mehrerer Vertriebler aus dem E-Mail-Programm
  • Aggregieren von Daten nach bestimmten Kriterien wie Kunden nach Vertriebsgebieten

Die Datenvalidierung ist der Schritt, in dem die Daten auf Richtigkeit (z.B. die E-Mail-Adresse enthält ein „@“), Schlüssigkeit (z.B., wenn Kunden Rechnungen per E-Mail erhalten sollen, muss eine E-Mail-Adresse hinterlegt sein) und Vollständigkeit (z.B. die E-Mail-Adresse ist an allen erforderlichen Stellen im System hinterlegt) überprüft werden. Dies stellt sicher, dass die Daten im richtigen Zusammenhang an der richtigen Stelle diverse Anforderungen für alle Verwendungen und Anwendungen erfüllen.

Beispiele:

  • Überprüfen, ob die E-Mail-Adresse ein „@“ enthält
  • Sicherstellen, dass eine E-Mail-Adresse hinterlegt ist, wenn Kunden Rechnungen per E-Mail erhalten sollen
  • Überprüfen, ob die E-Mail-Adresse an allen erforderlichen Stellen im System hinterlegt ist

Die Datenaktualisierung stellt sicher, dass die Daten auf dem neuesten Stand sind. Dies erfolgt, indem veraltete Informationen (z.B. alte E-Mail-Adressen) ersetzt und Statusinformationen (z.B. Insolvenz-Kennzeichen im ERP-System) angepasst werden.

Beispiele:

  • Ersetzen veralteter Informationen wie der Wechsel des Ansprechpartners
  • Anpassen von Statusinformationen wie Insolvenzen im Kundenstamm
  • Regelmäßige Datenimporte und Synchronisationen von Preisen und Lieferzeiten

Bei der Datenvisualisierung werden Daten grafisch abgebildet. Das können komprimierte Tabellen, Diagramme, Dashboards, Grafiken, Trendentwicklungen und Kennzahlenübersichten sein. Dies dient dem schnellen Überblick und der einfacheren Interpretation.

Beispiele:

  • Komprimierte Tabellen mit verdichteten Daten in tabellarischer Form
  • Diagramme wie Balken-, Linien- oder Kreisdiagramme
  • Dashboards mit interaktiven Visualisierungen, die mehrere Diagramme und Kennzahlen auf einer Seite zusammenfassen
  • Grafiken, die Muster und Trends aufzeigen
  • Trendentwicklungen, die Veränderungen über die Zeit zeigen
  • Kennzahlenübersichten mit Zusammenfassungen wichtiger Metriken und KPIs

Was bedeutet der Datenaufbereitungsprozess für Unternehmen?

Die Datenaufbereitung ist ein essenzieller Prozess, um sicherzustellen, dass Daten in der erforderlichen Qualität für Systeme und Analysen bereitgestellt werden.

Die einzelnen Schritte der Datenaufbereitung sind dabei von großer Bedeutung.

Durch die sorgfältige Durchführung der beschriebenen Schritte – von der Datenbeschaffung über die Datenbereinigung und -strukturierung bis hin zur Datenvisualisierung – können Unternehmen sicherstellen, dass ihre Daten zuverlässig, konsistent und nutzbar sind.

Dies bildet die Grundlage für datengestützte Entscheidungen und Prozessautomatisierungen mithilfe bestehender Systeme.

Weiterlesen im anderen Beitrag:

Haben Sie Bedarf in einem oder mehreren Bereichen erkannt? Vereinbaren Sie direkt einen Termin für eine unverbindliche Erstanalyse.

Profilbild Maria Meißner

MM - Maria Meißner:

Als Business-Analyst | Excel-Junkie | Realisierungs-Komplizin begeistern mich praxisnahe Umsetzungen, die zeitnah messbare Effekte für das Tagesgeschäft und den Unternehmenserfolg bringen. In den letzten 12+ Jahren durfte ich zahlreiche Projekte erfolgreich umsetzen - trotz Hürden, die das Tagesgeschäft mit sich brachte. Mir machen genau die Themen Spaß, die andere lästig finden: Datenqualität, Datenaufbereitung, Excel-Automatisierung und Anforderungsmanagement.

Weitere Beiträge

Rechtliche Hinweise finden Sie im Impressum.