Unzureichende Definitionen
Data Governance wird als der Prozess der Verwaltung der Verfügbarkeit, Nutzbarkeit, Integrität und Sicherheit der Daten in Unternehmenssystemen beschrieben. Das ist die moderne Definition. Das war nicht immer der Fall. Heute ist der Geltungsbereich so weit gefasst, dass das Wort „Data Governance“ bedeutungslos geworden ist. Es ist eine reine Überforderung! Data-Governance-Beauftragte haben ihre Charta neu erfunden und erweitert, um für ihren Job relevant zu bleiben, anstatt zuzugeben, dass das ursprüngliche Konstrukt auf wackligen Beinen steht. Tatsächlich sieht die erweiterte Charta der Data Governance verdächtig nach den Arbeitsprinzipien des Industrial Engineering aus – Zuverlässigkeit, Verfügbarkeit, Wartbarkeit, Sicherheit (kurz RAMS).
Das Wort „Governance“ erinnert an die Festlegung von Richtlinien und die Verwaltung der Einhaltung von Vorschriften. Und Richtlinien und Compliance sind erforderlich, weil mit der „Sache“ Risiken verbunden sind, die sich aus der Entscheidungsfindung ergeben. So gibt es z. B. eine Governance in der Medizin (Risiko von Fehlbehandlungen, die zum Verlust von Menschenleben führen), eine Governance bei Finanzprodukten (Risiko von schlechten Empfehlungen, die zu Geldverlusten führen) usw. Aber was sind die Risiken, die mit Daten durch Entscheidungsfindung verbunden sind?
Der ursprüngliche Schwerpunkt von Data Governance lag auf der Datenqualität, und darin sahen sie die Risiken. Ich würde jedoch behaupten, dass dieses Denken fehl am Platze ist – schlechte Datenqualität regelt sich von selbst, da ihr Ergebnis über die weitere Verwendung entscheidet. Das größere Problem ist jedoch, was Qualität bei Daten definiert. Viele Unternehmen konzentrieren sich auf fehlende Daten (d. h. Datenfelder, die nicht ausreichend ausgefüllt sind) oder auf die Genauigkeit der Daten (d. h. ob die Eingaben gültig sind). Aber selbst ausgereifte Organisationen verbringen nicht genug Zeit damit, über die Darstellung von Daten nachzudenken. Wie sollten sie auch, wenn Data Governance von Personen überwacht wird, die nichts von der Informationstheorie verstehen. Daten können genau sein (z. B. eine gültige Adresse), aber nicht repräsentativ (z. B. ist es nicht die Adresse des Kunden). Nehmen wir das Beispiel des Privatkundengeschäfts, wo Einkommen und Beruf wichtige Datenpunkte über den Kunden sind, da sie eine starke Korrelation zum Finanzverhalten aufweisen. Nur wenige Banken haben eine „Data Governance“-Richtlinie, die sich mit dem Ablauf und der kontinuierlichen Neuerfassung von Einkommens- und Berufsdaten befasst. Die meisten Banken denken nicht einmal über dieses Problem nach. Sie glauben, dass die Daten vollständig und brauchbar sind, nur weil die Datenfelder im System ausgefüllt werden und „korrekt“ sind. Dieses Versäumnis, die Haltbarkeit von Daten zu erkennen, wird von den Data-Governance-Beauftragten nur selten diskutiert.
Wenn Daten ein Vermögenswert sind …
Hier ist eine praktischere Art, über Data Governance nachzudenken. Eigentlich würde ich es gar nicht als Data Governance bezeichnen, da der Begriff eine falsche Bezeichnung ist. Jeder sagt, dass Daten ein Vermögenswert sind. Dem stimme ich zu. Und man ‚verwaltet‘ keine Vermögenswerte. Man ‚verwaltet‘ sie vielmehr. Man verwaltet Vermögenswerte so, dass wir ihre wirtschaftliche Lebensdauer verbessern und verlängern. Wir sollten also zurückgehen und die Grundsätze des Datenmanagements erweitern und die Data Governance vergessen. Der erweiterte Anwendungsbereich sollte sich auf die folgenden Ziele stützen:
- Dateninstrumentierung und ‑kuratierung → Adressierung der Angebotsseite der Ressource.
- Datenanreicherung und ‑verbesserung → Anreicherung des Vermögenswertes.
- Datenverteilung und ‑nutzung → Monetarisierung des Vermögenswerts.
All dies steht im Zusammenhang mit der größeren Diskussion über den Aufbau von Datenkompetenz und Datenstrategie, die das Thema meines bisher meistgelesenen Artikels war.
Dateninstrumentierung und ‑kuratierung erfordern strategische Absichten. Es erfordert ein Bewusstsein für bestehende Datenlücken, den Wert der Datenvielfalt, die Ethik der Datenerfassung und die zugrunde liegende Infrastruktur zur Organisation und Indexierung von Daten, einschließlich der Festlegung von Verfallsdaten und Auslösern für die erneute Erfassung.
Datenanreicherung und ‑verbesserung erfordern Kenntnisse der Informationstheorie, der Signalidentifizierung und der Signal-zu-Rausch-Verstärkung. Die Fähigkeit, Datenumwandlungs- und Datenvermischungstechniken auf den zugrunde liegenden Datenbestand anzuwenden und die Ergebnisse dann als zusätzliche Werte zu erkennen, ist von entscheidender Bedeutung.
Die Datenverteilung und ‑nutzung erfordert Kenntnisse darüber, wer welche Art von Daten benötigt und wer von zusätzlichen Daten profitieren kann (d. h. proaktives Anschieben und Empfehlen neuer Daten auf der Grundlage des Bereichs und der bisherigen Nutzung). Die Fähigkeit, nicht nur die Nutzung und Wiederverwendung von Daten zu messen, sondern auch den Bereich, in dem sie genutzt werden, ist entscheidend für das Verständnis des Monetarisierungswerts des Datenbestands.
Was ist mit KI?
Diese 3 Punkte zur Erweiterung des Datenverwaltungsumfangs lassen sich sehr gut mit der Unterstützung der KI-Strategie und sogar der schwer fassbaren „KI-Governance“ verbinden. Die Einführung von KI (sowohl traditionell als auch generativ) ist unvermeidlich. Aber KI ist keine neue Disziplin in Bezug auf Daten, sondern nur eine Datenanalyse in großem Maßstab. Daher sollten die Grundsätze der Vermögensverwaltung logischerweise Anwendung finden. Die wichtigsten Datenthemen in der KI sind (i) die genaue und ethische Beschaffung von Daten für Trainingszwecke, (ii) die Fähigkeit, intelligentes Feature-Engineering zu betreiben, um unnötigen Datenwust zu reduzieren, und (iii) das Schließen der Feedbackschleife zu Nutzen und Verwendbarkeit für eine kontinuierliche Feinabstimmung der Lösung. Dies sind nur grobe Umrisse der 3 Bereiche.
Schlussfolgerung
Data Governance ist tot, oder man sollte sie sterben lassen. Sie muss zum Datenmanagement heranreifen. Dabei geht es nicht nur um Semantik; die Auswirkungen sind erheblich. Die Verwaltung von Daten macht in der heutigen Wissenswirtschaft keinen logischen Sinn. Sie verwalten Lösungen, Sie verwalten Entscheidungen. Daten als Entität sind nicht der Ort, an dem die Risiken liegen, und die Konzentration auf Datenqualität und Datenzugriff ist keine echte Praxis oder Disziplin. Data Governance künstlich auf Verfügbarkeit und Nutzbarkeit auszuweiten, ist unaufrichtig. Verbeug dich, Data Governance. Es ist an der Zeit, weiterzugehen.
Quelle: medium.com