Heut­zu­tage wird auf dem Markt viel über Data-Clean-Rooms gespro­chen und es herrscht Ver­wir­rung dar­über, was genau ein Data-Clean-Room ist und wie er sich von ande­ren Data Sha­ring Metho­den unter­schei­det. Mit die­sem Blog­bei­trag wol­len wir für mehr Klar­heit sorgen. 

Was ist Data Sha­ring? 

Zu den her­kömm­li­chen Metho­den des Data Sha­ring gehö­ren das Kopie­ren von Dateien in FTP-/Cloud-Buckets, die Ver­wen­dung von ETL-Pipe­lines oder die Pflege und der Auf­ruf von APIs. Das Pro­blem bei die­sen her­kömm­li­chen Metho­den ist, dass sie eine effek­tive Zusam­men­ar­beit erschwe­ren und zu Wis­sens­lü­cken, unge­nauen Daten und Sicher­heits­pro­ble­men füh­ren kön­nen. Sobald Daten ver­scho­ben wer­den, sind sie nur so sicher wie der Ort, an den sie ver­scho­ben wer­den. Das ist nahezu unmög­lich zu kon­trol­lie­ren. Außer­dem kann es, neben zahl­rei­chen ande­ren Pro­ble­men, kost­spie­lig sein, benut­zer­de­fi­nierte Pipe­lines zu pflegen. 

Secure Data Sha­ring hin­ge­gen ist eine Funk­tion der Snow­flake-Platt­form, die es Unter­neh­men ermög­licht, einen siche­ren Zugriff auf ihre Daten zu gewäh­ren. Vor­bei sind die Zei­ten, in denen große Dateien über FTP kopiert oder ETL-Pipe­lines erstellt und gepflegt wer­den muss­ten. Anstatt Dateien von einem Sys­tem in ein ande­res zu kopie­ren, kön­nen Snowflake-Benutzer*innen bei­spiels­weise ein­fach fest­le­gen, auf wel­che Tabel­len inner­halb einer Daten­bank ein ande­rer Snow­flake-User zugrei­fen darf. 

Wann soll­ten Sie Secure Data Sha­ring nut­zen? 

Eine sichere Daten­frei­gabe ist dann sinn­voll, wenn Sie ein­fa­chen Zugriff auf einen Daten­satz gewäh­ren möch­ten. Zum Bei­spiel, wenn Sie Daten zwi­schen Geschäfts­ein­hei­ten oder mit ver­trau­ens­wür­di­gen Agen­tu­ren oder Part­nern zur Ana­lyse aus­tau­schen, um bes­sere Geschäfts­ent­schei­dun­gen und Ergeb­nisse zu erzie­len. Sie wird auch von Unter­neh­men oder Daten­an­bie­tern genutzt, die Daten mone­ta­ri­sie­ren oder ver­kau­fen, da sie ihren Kun­den einen siche­ren und wider­ruf­ba­ren Zugang bietet. 

Snow­flake Secure Data Sha­ring 

Die Platt­form von Snow­flake ermög­licht eine naht­lose Data Col­la­bo­ra­tion und hilft dabei, Kos­ten zu sen­ken und neue Geschäfts­er­kennt­nisse zu gewin­nen. Snow­flake Secure Data Sha­ring ermög­licht Unter­neh­men die sichere gemein­same Nut­zung von Daten in ihrem gesam­ten Geschäfts­um­feld, sodass sie: 

  • Schnel­len Zugriff auf Live-Daten aus dem gesam­ten Unter­neh­men haben 
  • Den Zugriff auf gemein­sam genutzte Daten kon­trol­lie­ren können 
  • Data Sets ein­fach für die Nut­zung ver­öf­fent­li­chen und gleich­zei­tig Zugriffs­kon­trol­len fest­le­gen können 

Snowflake’s Cloud Data Platt­form 

Mit Snow­flake kön­nen Unter­neh­men Daten nut­zen, Daten bereit­stel­len oder auch bei­des. Die Snow­flake Data Cloud ist zudem ein leis­tungs­star­kes Tool für Anwen­dun­gen, mit dem Kun­den Apps ent­de­cken, erstel­len und ver­tei­len kön­nen, die nativ in ihrem Snow­flake-Konto laufen. 

Unter­neh­men, die die Vor­teile der Snow­flake-Platt­form zur Erleich­te­rung einer daten­schutz­ge­rech­ten Zusam­men­ar­beit nut­zen, kön­nen von einer Viel­zahl von Vor­tei­len pro­fi­tie­ren, darunter: 

  • Gemein­same Nut­zung von Daten in ver­schie­de­nen Öko­sys­te­men ohne Kopie­ren oder Ver­schie­ben von Daten 
  • Ana­ly­sie­ren von Daten, ohne sie offenzulegen 
  • Erken­nen und Ver­wer­ten von Daten in der Snow­flake Data Cloud 
  • Sichere gemein­same Nut­zung von Daten mit Unter­neh­men, die Snow­flake nicht nutzen 

Die Daten von heute erfor­dern einen neuen Ansatz 

Unter­neh­men gene­rie­ren jedoch auch eine Fülle sen­si­bler und/oder regu­lier­ter Daten, die nicht an Dritte wei­ter­ge­ge­ben wer­den dür­fen, wie z. B. Kun­den­lis­ten und per­so­nen­be­zo­gene Daten (PII). Infol­ge­des­sen wer­den diese Daten ent­we­der nicht wei­ter­ge­ge­ben oder außer­halb des Unter­neh­mens, aus dem sie stam­men, gemein­sam bear­bei­tet, oder sie wer­den vor der Wei­ter­gabe agg­re­giert, was die Arten von Ana­ly­sen ein­schränkt, die durch­ge­führt wer­den kön­nen. Damit ein Unter­neh­men Erkennt­nisse gewin­nen oder Abfra­gen zu sen­si­blen und/oder regu­lier­ten Daten durch­füh­ren kann, ohne die zugrun­de­lie­gen­den Daten preis­zu­ge­ben, sollte es die Ver­wen­dung eines Data Clean Rooms in Betracht ziehen. 

Was ist ein Data Clean Room? 

„Die aktu­elle Dyna­mik der Bran­che hat die Nach­frage nach Aus­tausch und Zusam­men­ar­beit beschleu­nigt“, schreibt Jen­ni­fer Bel­li­sent, Prin­ci­pal Data Stra­te­gist bei Snow­flake. „Gleich­zei­tig haben neue Anwen­dungs­fälle und daten­in­ten­sive Ana­ly­se­me­tho­den zu einer explo­si­ons­ar­ti­gen Zunahme der Nach­frage nach Daten geführt. Aber auch die Besorg­nis über die Wah­rung des Daten­schut­zes hat zuge­nom­men. Diese Dyna­mik hat zu einem wah­ren Sturm geführt: die Not­wen­dig­keit einer siche­ren Data Col­la­bo­ra­tion über Data Clean Rooms.“ 

Ein Data Clean Room ist nicht unbe­dingt ein „Raum“. Wäh­rend einige tra­di­tio­nelle Clean Rooms eine phy­si­sche Infrastruktur erfor­dern, sind moderne Data Clean Rooms keine phy­si­schen Räume, son­dern eher ein Rah­men, in dem die Daten nicht in ein ande­res Sys­tem oder eine andere Umge­bung ver­scho­ben wer­den müssen. 

Ein Data Clean Room unter­schei­det sich vom Data Sha­ring dadurch, dass ein Anbie­ter Regeln für die Arten von Abfra­gen fest­le­gen kann, die auf den Daten aus­ge­führt wer­den kön­nen. Dem Unter­neh­men, das die Abfra­gen aus­führt, wird jedoch der Zugriff auf die zugrunde lie­gen­den Daten selbst verwehrt. 

Secure Data Sha­ring und Data Clean Rooms ähneln sich inso­fern, als dass sie zwei oder mehr Par­teien die sichere Zusam­men­ar­beit an Daten ermög­li­chen. Aber so wie siche­res Data Sha­ring eine große Ver­bes­se­rung gegen­über den her­kömm­li­chen Metho­den der gemein­sa­men Daten­nut­zung war, ist das Auf­kom­men von Data Clean Rooms der nächste große Schritt in Rich­tung siche­rer Data Col­la­bo­ra­tion-Metho­den für Unternehmen. 

Brau­chen Sie einen Data Clean Room? 

Um es noch ein­mal zu sagen: Secure Data Sha­ring ist eine groß­ar­tige Option für die gemein­same Nut­zung von Daten zwi­schen Geschäfts­ein­hei­ten oder mit ver­trau­ens­wür­di­gen Drit­ten. Es gibt jedoch ver­schie­dene Sze­na­rien, in denen ein Unter­neh­men sich für die Ein­rich­tung einer Data Clean Room-Umge­bung ent­schei­den sollte. 

Mit der Ein­füh­rung ver­schie­de­ner Vor­schrif­ten, dar­un­ter der Cali­for­nia Con­su­mer Pri­vacy Act (CCPA) und die Gene­ral Data Pro­tec­tion Regu­la­tion (GDPR), müs­sen Ver­brau­cher­da­ten nun unter Ein­hal­tung stren­ger Daten­schutz­be­stim­mun­gen behan­delt wer­den. Die Zusam­men­ar­beit mit ande­ren Unter­neh­men unter Ver­wen­dung eines Data Clean Rooms ist eine Lösung, die genutzt wer­den kann, wenn die Daten bei­der Par­teien sen­si­bel und/oder regu­liert sind. 

Für Medien- und Wer­be­un­ter­neh­men kann ein Data Clean Room zum Bei­spiel per­so­na­li­sierte Seg­ment­ein­bli­cke für Wer­bung und Kam­pa­gnen­at­tri­bu­tion unter Wah­rung der Pri­vat­sphäre ermög­li­chen. So nutzt ein mul­ti­na­tio­na­les Medi­en­un­ter­neh­men eine von Snow­flake unter­stützte Cloud-über­grei­fende Data Clean Room-Umge­bung, um seine First-Party-Publi­kums­da­ten an Wer­be­part­ner wei­ter­zu­lei­ten, die diese dann sicher mit ihren eige­nen Daten­sät­zen ver­knüp­fen kön­nen – ohne die zugrunde lie­gen­den per­so­nen­be­zo­ge­nen Daten zu ver­schie­ben, zu kopie­ren oder offenzulegen. 

In der Tat sollte ein Data Clean Room für jede Bran­che in Betracht gezo­gen wer­den, wel­che über sen­si­ble und/oder regu­lierte Daten ver­fügt, ins­be­son­dere wenn der Wert (oder das Risiko) der Zusam­men­ar­beit an die­sen Daten hoch ist. 

Snow­flake Glo­bal Data Clean Room 

Snow­flake Glo­bal Data Clean Room ist ein Frame­work für die sichere Zusam­men­ar­beit meh­re­rer Par­teien. Es ermög­licht zwei oder mehr Snow­flake-Kun­den, Daten zu ana­ly­sie­ren, ohne die Roh­da­ten gegen­sei­tig offen­zu­le­gen. Es han­delt sich um eine Lösung, die zen­trale Snow­flake-Funk­tio­nen für die Zusam­men­ar­beit und Daten­ver­wal­tung nutzt, wie z. B.: 

  • Richt­li­nien für den Zei­len­zu­griff und Daten­bank­rol­len, mit denen die Betei­lig­ten Kun­den­da­ten abglei­chen kön­nen, ohne dass die per­so­nen­be­zo­ge­nen Daten der Betei­lig­ten offen­ge­legt werden 
  • Stored Pro­ce­du­res zur Gene­rie­rung und Vali­die­rung von Abfragen 
  • Siche­res Data Sha­ring für die auto­ma­ti­sche und sichere Frei­gabe von Tabel­len zwi­schen meh­re­ren Snow­flake-Kon­ten, ohne dass die Daten außer­halb von Snow­flake ver­scho­ben wer­den müsse 

Zu den wich­tigs­ten Vor­tei­len des Snow­flake Glo­bal Data Clean Room gehören: 

  • Ermög­li­chen Sie es zwei oder mehr Par­teien, Daten über Clouds und Regio­nen hin­weg zu ana­ly­sie­ren, ohne diese gegen­sei­tig preiszugeben. 
  • Schutz vor Reverse Engi­nee­ring oder Re-Iden­ti­fi­zie­rung hoch­sen­si­bler Daten durch die Begren­zung der Abfra­ge­ty­pen, die auf den Daten aus­ge­führt wer­den können. 
  • Über­prü­fen Sie den Zugriff auf den glo­ba­len Data Clean Room mit benut­zer­de­fi­nier­ter Ereignisprotokollierung 

Wel­cher Ansatz ist der beste für mein Unter­neh­men? 

Jeg­li­che Data Col­la­bo­ra­tion in Unter­neh­men sollte sicher sein, so dass das Kopie­ren von Daten mit alten Metho­den über­flüs­sig wird. Wenn Sie mit ver­trau­ens­wür­di­gen Part­nern zusam­men­ar­bei­ten und diese Zusam­men­ar­beit nicht gegen Daten­schutz­be­stim­mun­gen ver­stößt, ist die Ver­wen­dung von Snow­flake Secure Data Sha­ring ein prak­ti­ka­bler Ansatz, da er schnell, ein­fach und sicher ist. Wenn Sie hin­ge­gen mit der Zusam­men­ar­beit an sen­si­blen und/oder regu­lier­ten Daten begin­nen und das Risiko der Zusam­men­ar­beit an die­sen Daten hoch ist, soll­ten Sie die Ver­wen­dung eines Data Clean Rooms in Betracht ziehen. 

Quelle: Snow­flake

Erfah­ren Sie hier mehr über Lösun­gen im Bereich Snow­flake oder besu­chen Sie eines unse­rer kos­ten­lo­sen Web­i­nare.