Unzu­rei­chende Definitionen

Data Gover­nance wird als der Pro­zess der Ver­wal­tung der Ver­füg­bar­keit, Nutz­bar­keit, Inte­gri­tät und Sicher­heit der Daten in Unter­neh­mens­sys­te­men beschrie­ben. Das ist die moderne Defi­ni­tion. Das war nicht immer der Fall. Heute ist der Gel­tungs­be­reich so weit gefasst, dass das Wort „Data Gover­nance“ bedeu­tungs­los gewor­den ist. Es ist eine reine Über­for­de­rung! Data-Gover­nance-Beauf­tragte haben ihre Charta neu erfun­den und erwei­tert, um für ihren Job rele­vant zu blei­ben, anstatt zuzu­ge­ben, dass das ursprüng­li­che Kon­strukt auf wack­li­gen Bei­nen steht. Tat­säch­lich sieht die erwei­terte Charta der Data Gover­nance ver­däch­tig nach den Arbeits­prin­zi­pien des Indus­trial Engi­nee­ring aus – Zuver­läs­sig­keit, Ver­füg­bar­keit, Wart­bar­keit, Sicher­heit (kurz RAMS). 

Das Wort „Gover­nance“ erin­nert an die Fest­le­gung von Richt­li­nien und die Ver­wal­tung der Ein­hal­tung von Vor­schrif­ten. Und Richt­li­nien und Com­pli­ance sind erfor­der­lich, weil mit der „Sache“ Risi­ken ver­bun­den sind, die sich aus der Ent­schei­dungs­fin­dung erge­ben. So gibt es z. B. eine Gover­nance in der Medi­zin (Risiko von Fehl­be­hand­lun­gen, die zum Ver­lust von Men­schen­le­ben füh­ren), eine Gover­nance bei Finanz­pro­duk­ten (Risiko von schlech­ten Emp­feh­lun­gen, die zu Geld­ver­lus­ten füh­ren) usw. Aber was sind die Risi­ken, die mit Daten durch Ent­schei­dungs­fin­dung ver­bun­den sind?

Der ursprüng­li­che Schwer­punkt von Data Gover­nance lag auf der Daten­qua­li­tät, und darin sahen sie die Risi­ken. Ich würde jedoch behaup­ten, dass die­ses Den­ken fehl am Platze ist – schlechte Daten­qua­li­tät regelt sich von selbst, da ihr Ergeb­nis über die wei­tere Ver­wen­dung ent­schei­det. Das grö­ßere Pro­blem ist jedoch, was Qua­li­tät bei Daten defi­niert. Viele Unter­neh­men kon­zen­trie­ren sich auf feh­lende Daten (d. h. Daten­fel­der, die nicht aus­rei­chend aus­ge­füllt sind) oder auf die Genau­ig­keit der Daten (d. h. ob die Ein­ga­ben gül­tig sind). Aber selbst aus­ge­reifte Orga­ni­sa­tio­nen ver­brin­gen nicht genug Zeit damit, über die Dar­stel­lung von Daten nach­zu­den­ken. Wie soll­ten sie auch, wenn Data Gover­nance von Per­so­nen über­wacht wird, die nichts von der Infor­ma­ti­ons­theo­rie ver­ste­hen. Daten kön­nen genau sein (z. B. eine gül­tige Adresse), aber nicht reprä­sen­ta­tiv (z. B. ist es nicht die Adresse des Kun­den). Neh­men wir das Bei­spiel des Pri­vat­kun­den­ge­schäfts, wo Ein­kom­men und Beruf wich­tige Daten­punkte über den Kun­den sind, da sie eine starke Kor­re­la­tion zum Finanz­ver­hal­ten auf­wei­sen. Nur wenige Ban­ken haben eine „Data Governance“-Richtlinie, die sich mit dem Ablauf und der kon­ti­nu­ier­li­chen Neu­erfas­sung von Ein­kom­mens- und Berufs­da­ten befasst. Die meis­ten Ban­ken den­ken nicht ein­mal über die­ses Pro­blem nach. Sie glau­ben, dass die Daten voll­stän­dig und brauch­bar sind, nur weil die Daten­fel­der im Sys­tem aus­ge­füllt wer­den und „kor­rekt“ sind. Die­ses Ver­säum­nis, die Halt­bar­keit von Daten zu erken­nen, wird von den Data-Gover­nance-Beauf­trag­ten nur sel­ten diskutiert.

Wenn Daten ein Ver­mö­gens­wert sind …

Hier ist eine prak­ti­schere Art, über Data Gover­nance nach­zu­den­ken. Eigent­lich würde ich es gar nicht als Data Gover­nance bezeich­nen, da der Begriff eine fal­sche Bezeich­nung ist. Jeder sagt, dass Daten ein Ver­mö­gens­wert sind. Dem stimme ich zu. Und man ‚ver­wal­tet‘ keine Ver­mö­gens­werte. Man ‚ver­wal­tet‘ sie viel­mehr. Man ver­wal­tet Ver­mö­gens­werte so, dass wir ihre wirt­schaft­li­che Lebens­dauer ver­bes­sern und ver­län­gern. Wir soll­ten also zurück­ge­hen und die Grund­sätze des Daten­ma­nage­ments erwei­tern und die Data Gover­nance ver­ges­sen. Der erwei­terte Anwen­dungs­be­reich sollte sich auf die fol­gen­den Ziele stützen:

  • Daten­in­stru­men­tie­rung und ‑kura­tie­rung → Adres­sie­rung der Ange­bots­seite der Ressource.
  • Daten­an­rei­che­rung und ‑ver­bes­se­rung → Anrei­che­rung des Vermögenswertes.
  • Daten­ver­tei­lung und ‑nut­zung → Mone­ta­ri­sie­rung des Vermögenswerts.

All dies steht im Zusam­men­hang mit der grö­ße­ren Dis­kus­sion über den Auf­bau von Daten­kom­pe­tenz und Daten­stra­te­gie, die das Thema mei­nes bis­her meist­ge­le­se­nen Arti­kels war.

Daten­in­stru­men­tie­rung und ‑kura­tie­rung erfor­dern stra­te­gi­sche Absich­ten. Es erfor­dert ein Bewusst­sein für bestehende Daten­lü­cken, den Wert der Daten­viel­falt, die Ethik der Daten­er­fas­sung und die zugrunde lie­gende Infrastruktur zur Orga­ni­sa­tion und Inde­xie­rung von Daten, ein­schließ­lich der Fest­le­gung von Ver­falls­da­ten und Aus­lö­sern für die erneute Erfassung.

Daten­an­rei­che­rung und ‑ver­bes­se­rung erfor­dern Kennt­nisse der Infor­ma­ti­ons­theo­rie, der Signal­iden­ti­fi­zie­rung und der Signal-zu-Rausch-Ver­stär­kung. Die Fähig­keit, Daten­um­wand­lungs- und Daten­ver­mi­schungs­tech­ni­ken auf den zugrunde lie­gen­den Daten­be­stand anzu­wen­den und die Ergeb­nisse dann als zusätz­li­che Werte zu erken­nen, ist von ent­schei­den­der Bedeutung.

Die Daten­ver­tei­lung und ‑nut­zung erfor­dert Kennt­nisse dar­über, wer wel­che Art von Daten benö­tigt und wer von zusätz­li­chen Daten pro­fi­tie­ren kann (d. h. pro­ak­ti­ves Anschie­ben und Emp­feh­len neuer Daten auf der Grund­lage des Bereichs und der bis­he­ri­gen Nut­zung). Die Fähig­keit, nicht nur die Nut­zung und Wie­der­ver­wen­dung von Daten zu mes­sen, son­dern auch den Bereich, in dem sie genutzt wer­den, ist ent­schei­dend für das Ver­ständ­nis des Mone­ta­ri­sie­rungs­werts des Datenbestands.

Was ist mit KI?

Diese 3 Punkte zur Erwei­te­rung des Daten­ver­wal­tungs­um­fangs las­sen sich sehr gut mit der Unter­stüt­zung der KI-Stra­te­gie und sogar der schwer fass­ba­ren „KI-Gover­nance“ ver­bin­den. Die Ein­füh­rung von KI (sowohl tra­di­tio­nell als auch gene­ra­tiv) ist unver­meid­lich. Aber KI ist keine neue Dis­zi­plin in Bezug auf Daten, son­dern nur eine Daten­ana­lyse in gro­ßem Maß­stab. Daher soll­ten die Grund­sätze der Ver­mö­gens­ver­wal­tung logi­scher­weise Anwen­dung fin­den. Die wich­tigs­ten Daten­the­men in der KI sind (i) die genaue und ethi­sche Beschaf­fung von Daten für Trai­nings­zwe­cke, (ii) die Fähig­keit, intel­li­gen­tes Fea­ture-Engi­nee­ring zu betrei­ben, um unnö­ti­gen Daten­wust zu redu­zie­ren, und (iii) das Schlie­ßen der Feed­back­schleife zu Nut­zen und Ver­wend­bar­keit für eine kon­ti­nu­ier­li­che Fein­ab­stim­mung der Lösung. Dies sind nur grobe Umrisse der 3 Bereiche.

Schluss­fol­ge­rung

Data Gover­nance ist tot, oder man sollte sie ster­ben las­sen. Sie muss zum Daten­ma­nage­ment her­an­rei­fen. Dabei geht es nicht nur um Seman­tik; die Aus­wir­kun­gen sind erheb­lich. Die Ver­wal­tung von Daten macht in der heu­ti­gen Wis­sens­wirt­schaft kei­nen logi­schen Sinn. Sie ver­wal­ten Lösun­gen, Sie ver­wal­ten Ent­schei­dun­gen. Daten als Enti­tät sind nicht der Ort, an dem die Risi­ken lie­gen, und die Kon­zen­tra­tion auf Daten­qua­li­tät und Daten­zu­griff ist keine echte Pra­xis oder Dis­zi­plin. Data Gover­nance künst­lich auf Ver­füg­bar­keit und Nutz­bar­keit aus­zu­wei­ten, ist unauf­rich­tig. Ver­beug dich, Data Gover­nance. Es ist an der Zeit, weiterzugehen.

Quelle: medium.com