Überall, wo wir heute im Bereich der Cloud-Daten hingehen, hören wir laut und deutlich eine Botschaft: „Sie sollten über Data Governance nachdenken“. Dieser Meinung schließen wir uns von ganzem Herzen an, aber wir gehen noch einen Schritt weiter: Sie sollten über Data Governance anders denken.
In diesem Artikel nenne ich sechs der Hauptgründe, aus denen Data-Governance-Initiativen selbst bei den besten Datenteams scheitern – und wie Sie vermeiden können, in dieselben Fallen zu tappen.
Sie denken, bei Data Governance geht es um richtig und falsch
Bei einem großen Ridesharing-Unternehmen hatten zwei Teams monatelang damit zu kämpfen, ihre Berichte abzustimmen. Egal, was sie taten, sie waren nie in der Lage, die gleichen Ergebnisse zu erzielen, selbst wenn sie darauf bestanden, dass sie ihre Metriken auf die gleiche Weise definierten, die gleichen Tabellen abfragten und den Code Zeile für Zeile durchgingen. DAS42 nahm die Herausforderung an, und was wir fanden, wurde zu einem unserer Lieblingsbeispiele für die Wichtigkeit von Data Governance.
Ein Team verwendete einen Filter für „Mega-Region = ‚USA und Kanada‘ “. Das andere Team verwendete einen Filter für „country-code = 1 (USA) OR 32 (Kanada)“. Uns wurde gesagt, dass dies dasselbe sei. Aber natürlich sahen wir uns die Zuordnungstabelle an und stellten fest, dass der Ländercode 1 Puerto Rico einschloss, die Megaregion „USA und Kanada“ jedoch nicht.
Es ging nicht darum, dass ein Team Recht hatte und das andere Unrecht. Es lag vielmehr daran, dass keines der beiden Teams vollständig verstand, was in seiner Metrik enthalten oder ausgeschlossen war.
Dies ist einer der häufigsten Data-Governance-Fehler, die wir sehen, und er hat zu einigen der schlimmsten und entmutigendsten Datenprobleme bei unseren Kunden geführt.
Es reicht nicht aus, auf eine Abfrage oder eine Ausgabe zu zeigen und zu sagen: „Dies ist die Quelle der Wahrheit“ – zu sagen: „Diese Zahl ist richtig, und jede andere Zahl ist falsch“. Denn im Grunde geht es bei der Data Governance nicht um richtig oder falsch. Beide oben genannten Teams hatten Zahlen, die je nach Anwendungsfall gültig waren – je nachdem, was der Stakeholder meinte, als er sagte: „Wir wollen diese Zahlen für die USA und Kanada“.
Das soll nicht heißen, dass es so etwas wie eine „falsche“ Zahl nicht gibt. Natürlich haben wir auch schon erlebt, dass Analysten versucht haben, Testkonten mit einer Klausel wie „Nachname enthält nicht ‚test‘ “ auszuschließen, was für echte Menschen mit Nachnamen wie Battesten oder Contestanza eine Schande ist. (Uns ist noch kein echter Mensch namens Testy McTesterson begegnet, aber es sind schon seltsamere Dinge passiert.)
Es ist jedoch nicht sinnvoll, eine Zahl – zum Beispiel eine metrische Definition – als richtig festzulegen, wenn Sie nicht in der Lage sind zu erklären, was sie von den anderen unterscheidet.
Verändern Sie Ihre Denkweise von „wir müssen wissen, welche dieser Zahlen richtig und welche falsch sind“ zu „wir müssen diese Zahlen verstehen, was in ihnen steckt, was sie unterscheidet und in welchen Kontexten es angemessen wäre, sie zu verwenden“.
Sie legen zu viel Wert auf die Beteiligung der Führungskräfte
Verstehen Sie uns nicht falsch – natürlich ist es ein mächtiges Werkzeug in Ihrem Werkzeugkasten, wenn angesehene leitende Teammitglieder für Ihre Data-Governance-Initiativen eintreten. Aber es ist auch absolut wichtig, dass die Menschen, die tagtäglich mit den Daten umgehen – Ihre Mitarbeiter an der Front, Ihre Techniker, Ihre Projektmanager – die Menschen, die ihre Prozesse ändern müssen, damit Sie einen Governance-Rahmen vollständig implementieren können, ebenfalls zustimmen.
Bevor Sie versuchen, die Führungsebene und die Stakeholder zu überzeugen, ist es wichtig, den aktuellen Stand Ihrer Data-Governance-Strategie transparent zu machen. Überlegen Sie, wie Sie die folgenden Fragen beantworten könnten:
- Wie messen Sie die Datenqualität der Daten, die Ihr Unternehmen sammelt und speichert?
- Was sind die KPIs oder allgemeinen Ziele, für deren Erfüllung Sie Ihre Data-Governance-Strategie verantwortlich machen werden?
- Gibt es eine funktionsübergreifende Beteiligung von Führungskräften und Datennutzern in anderen Bereichen des Unternehmens?
- Wer im Unternehmen ist für die Erfüllung der KPIs und Ziele Ihrer Strategie verantwortlich?
- Welche Kontrollmechanismen gibt es, um sicherzustellen, dass die KPIs korrekt gemessen und die Ziele erreicht werden können?
Genauso wie die Einsicht in Ihre Datenpipelines die Sicherstellung einer hohen Datenqualität erleichtert, ist die Transparenz Ihrer Data-Governance-Strategie und ihres schrittweisen Fortschritts von entscheidender Bedeutung, wenn es darum geht, alle Mitglieder Ihres Führungsteams zu informieren und zur Verantwortung zu ziehen.
Sie betrachten die Implementierung von Data Governance als ein Projekt
Es gibt zwei Hauptfehler, die Datenverantwortliche machen, wenn es um die Implementierung eines Data-Governance-Rahmens geht. Der erste ist die „Einstellen und vergessen“-Mentalität. Sie betrachten Data Governance als eine Initiative, die abgeschlossen werden muss, und denken, dass sie, sobald sie abgeschlossen ist, mit der nächsten weitermachen können. Der zweite Fehler ist ähnlich, nämlich die Neigung zur Überregulierung. Beide Ansätze sind zwar verständlich, gehen aber am Kern dessen vorbei, was Data Governance eigentlich sein soll.
Genau wie die Dateneingabe oder die Qualitätssicherung ist Data Governance ein Prozess. Es mag am Anfang mehr bewusste Anstrengungen erfordern, aber Data Governance ist kein Projekt, das jemals wirklich abgeschlossen ist. Wenn Ihr Unternehmen wächst und sich weiterentwickelt, werden sich auch Ihre Metrikdefinitionen mit ihm weiterentwickeln. Das Problem mit den oben genannten Ansätzen ist, dass sie keinen Raum für Veränderungen lassen.
Denken Sie daran, dass es bei der Data Governance weniger um das Richtig oder Falsch Ihrer Kennzahlen geht, sondern vielmehr darum, den kulturellen Ansatz Ihres Unternehmens in Bezug auf diese Kennzahlen zu ändern. Betrachten Sie Data Governance nicht als etwas, das abgeschlossen werden muss, sondern als etwas, das angenommen werden muss.
Sie denken, dass ein Werkzeug die ganze schwere Arbeit übernimmt
Die Datenlandschaft ist voll von Tools, Managed Services, Methoden und Frameworks, und wir leugnen nicht, dass viele von ihnen Ihnen helfen können, Ihre Daten auf die nächste Stufe zu heben. Datenbeobachtung ist eines davon. Aber wie bereits erwähnt, ist Data Governance kein einzelnes Tool oder ein Arbeitsablauf, den Sie einmal einrichten, und schon sind alle Probleme gelöst – es ist ein fortlaufender Prozess, der Urteilsvermögen, Entscheidungsfindung und Differenzierung erfordert.
Während Datenkataloge und andere Governance-Lösungen oft als die Antwort auf alle Datenprobleme Ihres Unternehmens vermarktet werden, sind viele Datenverantwortliche der Meinung, dass diese Tools selbst bei den rudimentärsten Aspekten unzureichend sind, wenn es um manuelle Anforderungen geht.
Es gibt Tools und Unternehmen, die die Dinge einfacher machen, Prozesse automatisieren und Ihnen helfen, über Ihre Annahmen hinauszugehen. Aber trotz aller Innovationen, die wir in den letzten zehn Jahren in der Datenlandschaft gesehen haben, gibt es immer noch keinen technologischen Ersatz für die schwierige (und ungemein befriedigende) Arbeit, über Ihr Unternehmen, Ihre Prozesse, Ihre Definitionen, Ihre Messungen und Ihre Ziele zu sprechen.
Sie denken, Sie können sich allein auf Data Governance konzentrieren
Einige der ernsthaftesten Stakeholder, die wir erlebt haben, bekennen sich zu ihrem Engagement für die Implementierung von Data Governance, indem sie es an die Spitze ihrer Prioritätenliste setzen – und alles andere auf Eis legen. Sie wollen alles regeln, und zwar sofort. Dies kann mehrere Probleme verursachen.
Erstens kann es zu Frustration und Enttäuschung bei den Beteiligten führen, da sie keine wesentlichen Vorteile in Form von neuen Ergebnissen sehen. (Natürlich gibt es einige von uns, die Data Governance für ungeheuer spannend halten, aber wahrscheinlich ist nicht jeder in Ihrem Unternehmen ein solcher Nerd).
Zweitens: Wenn Sie es versäumen, einen iterativen Ansatz zu verfolgen, kommen die praktischen Lehren möglicherweise zu spät. Wir haben schon erlebt, dass Unternehmen „alles regeln“ und dann, ein paar Wochen nachdem sie fertig sind und alles implementiert wurde, feststellen, dass sie etwas Wichtiges übersehen haben… und zwar in allen Bereichen. Wir haben bereits erwähnt, wie wichtig es ist, die Zustimmung der Beteiligten auf allen Ebenen einzuholen.
Wählen Sie zu Beginn Ihrer Data-Governance-Reise ein paar wichtige Beispiele aus. Diese könnten für Ihr Unternehmen von grundlegender Bedeutung sein – vielleicht müssen Sie Ihre Kategorien oder Produkthierarchien definieren, Ihren operativen Nettoumsatz oder Ihre Verfügbarkeitsrate bestimmen, oder Sie müssen definieren, was Sie mit dem Wort „Kunde“ meinen. (Wie schließen Sie überhaupt diese Testkonten aus?) Wählen Sie zwei oder drei Bereiche aus, die besonders wichtig sind. Bauen Sie Ihre Governance-Muskeln auf und sorgen Sie dafür, dass sie nachhaltig ist – etwas, das Sie neben Ihrer täglichen Arbeit und den „Business-as-usual“-Ergebnissen tun können.
Und lassen Sie sich Zeit, um daraus zu lernen, während Sie zum nächsten und zum übernächsten Schritt übergehen.
Sie wissen nicht, welche Daten wirklich wichtig sind
Sobald Sie die ersten Bereiche identifiziert haben, auf die Sie sich konzentrieren möchten, müssen Sie im nächsten Schritt sicherstellen, dass die Daten, die Sie verwalten, es auch wert sind, verwaltet zu werden. Nicht alle Daten sind gleich, und im heutigen wirtschaftlichen Klima ist es nicht falsch zu sagen, dass einige Daten mehr wert sind als andere. So sind beispielsweise Daten, die den Umsatz Ihres Unternehmens für das nächste Quartal prognostizieren, wahrscheinlich mehr Ihrer Aufmerksamkeit wert als eine doppelte Tabelle, die in einer staubigen Ecke Ihres Snowflake-Lagers liegt.
Bevor Sie Ihre Governance-Strategie einführen, sollten Sie ermitteln, welche Daten für Ihr Unternehmen tatsächlich am wichtigsten sind, und entsprechende Prioritäten setzen. Ein Einblick in Ihre wichtigsten Daten – unabhängig davon, in welchem Stadium der Pipeline sie sich befinden – kann sicherstellen, dass Ihr Team a) Zeit für den Aufbau eines Data-Governance-Programms für Daten aufwendet, die das Unternehmen tatsächlich nutzt, und b) Ihnen sagen kann, ob die Daten verfügbar, aktuell und vor allem korrekt sind.
Eine Möglichkeit, dies zu tun? Legen Sie Service-Level-Agreements (SLAs) und Service-Level-Indikatoren (SLIs) für die Datenbestände fest, die am meisten beachtet werden, z. B. die Tabelle, die das vierteljährliche Kennzahlen-Dashboard Ihres CFO speist, oder die Salesforce-Daten, die Ihre Werbekampagnen unterstützen.
Die Festlegung von SLAs für die Datenzuverlässigkeit trägt zum Aufbau von Vertrauen und zur Stärkung der Beziehungen zwischen Ihren Daten, Ihrem Datenteam und den nachgelagerten Verbrauchern bei – seien es Ihre Kunden oder funktionsübergreifende Teams in Ihrem Unternehmen. Ohne diese klar definierten Metriken könnten die Verbraucher falsche Annahmen treffen oder sich auf anekdotische Beweise über die Zuverlässigkeit und Vertrauenswürdigkeit Ihrer Datenplattform verlassen. Mit anderen Worten: Daten-SLAs helfen Ihrem Unternehmen, datenorientierter mit Daten umzugehen – und damit auch mit Data Governance.
Also, fangen wir an.
In den meisten Unternehmen wird Data Governance einigen wenigen Einzelkämpfern überlassen, die ein ganzes Team von „Zahlenmenschen“ davon überzeugen sollen, sich um etwas zu kümmern, das von Natur aus schwer zu quantifizieren ist. Wenn das nach einer Falle klingt, dann ist es auch eine – aber das muss nicht sein.
Letztendlich besteht das Ziel Ihrer Data-Governance-Strategie darin, sicherzustellen, dass sich die Teams im gesamten Unternehmen befähigt fühlen, Daten zu nutzen, und der einzige Weg, dies zu tun, besteht darin, Vertrauen zu schaffen und Aufklärung zu betreiben.
Unser wichtigster Ratschlag: Beginnen Sie Ihre Governance-Initiative in einigen wenigen funktionalen Schlüsselbereichen (landen und erweitern), mit der Nachverfolgung einiger wichtiger SLAs und einer Handvoll kritischer Datenbestände. In einer Welt, in der größer (Daten) immer besser ist, lohnt es sich manchmal, klein anzufangen.
Quelle: medium.com
Lesen Sie hier mehr über Lösungen im Bereich Machine Learning Development oder besuchen Sie eines unserer kostenlosen Webinare.