Bei der Aus­füh­rung bzw. Migra­tion von SSIS-Pake­ten in die Azure Cloud gibt es gemäß For­res­ter vier ver­schie­dene Möglichkeiten:

  • Lift & Shift
  • Lift & Extend
  • Hybrid Exten­sion
  • Full Rebuild

Lift & Shift bezeich­net hier­bei eine mehr oder weni­ger direkte Migra­tion mit ledig­lich gerin­gen erfor­der­li­chen Anpas­sun­gen der bis­he­ri­gen Infrastruktur zu einer Cloudumgebung.

Bei Lift & Extend wer­den die eige­nen Anwen­dun­gen vor­her so ange­passt, um opti­mal mit der Cloud­platt­form (PaaS) zusam­men­ar­bei­ten zu kön­nen und basie­rend auf die­ser Platt­form spä­tere Erwei­te­run­gen bzw. Anpas­sun­gen vor­neh­men zu können.

Bei Hybrid Exten­si­ons wer­den ledig­lich einige Funk­tio­nen in die Cloud aus­ge­la­gert, wäh­rend der Kern der Anwen­dun­gen bzw. die Daten wei­ter­hin auf den Ser­vern der Unter­neh­men verbleiben.

Full Rebuilds bezeich­nen eine kom­plette Trans­for­ma­tion der bestehen­den Umge­bung. Die jewei­li­gen Anwen­dun­gen wer­den voll­stän­dig neu ent­wi­ckelt, um die Cloud-Mög­lich­kei­ten opti­mal nut­zen zu können.

Im Rah­men von ETL/ELT-Pro­zes­sen bie­tet Azure die Platt­form Data Fac­tory an. Bis­her war durch die feh­lende Unter­stüt­zung der SQL Ser­ver Inte­gra­tion Ser­vices (SSIS) eine ein­fa­che Lift-&-Shift-Migration bestehen­der Sys­teme nicht möglich.

Mit Ver­öf­fent­li­chung von Azure Data Fac­tory V2 hat sich dies grund­le­gend geändert!

Gründe für die Migra­tion in die Cloud

Für eine Migra­tion in die Azure-Umge­bung spre­chen gute Gründe, die sich in den häu­fig auf­tre­ten­den Aus­las­tungs­mus­tern zeigen:

1. On-&-Off-Workloads

Gerade bei Batch-Jobs wer­den die Rechen­res­sour­cen nicht durch­ge­hend ver­wen­det, son­dern nur teil­weise. Dies führt zu ver­schwen­de­ten Kapa­zi­tä­ten im Rechenzentrum.

2. Unvor­her­ge­se­hene Belastungen

Im schnell­le­bi­gen Com­pu­ter­zeit­al­ter kön­nen virale Effekte plötz­lich zu erhöh­ten kurz­fris­ti­gen Nach­fra­ge­spit­zen füh­ren, die von einem eige­nen Rechen­zen­trum nicht ohne wei­te­res abge­fan­gen wer­den können.

3. Vor­her­seh­bare Belastungen

Sai­so­nale Schwan­kun­gen in der Nach­frage stel­len einen Ziel­kon­flikt für die Res­sour­cen­pla­nung dar. Man will sowohl die gesamte Nach­frage erfolg­reich bedie­nen kön­nen, aller­dings auch keine unnö­ti­gen Res­sour­cen für große Zeit­span­nen haben (vgl. Aus­las­tungs­mus­ter 1)

4. Schnel­les Wachstum

Gerade bei dis­rup­ti­ven Geschäfts­mo­del­len kann es zu schnel­len Wachs­tums­ra­ten kom­men. Inves­ti­tio­nen in ein Rechen­zen­trum, das kon­ti­nu­ier­lich auf­ge­rüs­tet wer­den müsste, ist kaum durchführbar.

Hier ent­wi­ckeln Cloud­lö­sun­gen ihre große Stärke:
Dadurch, dass nur genutzte Leis­tun­gen ange­rech­net wer­den, kön­nen Unter­neh­men die benö­tig­ten Leis­tun­gen schnell ent­spre­chend der Nach­frage skalieren.

Azure Data Fac­tory V2

Mit Azure Data Fac­tory V2 (ADF) stellt Micro­soft einen Daten­in­te­gra­ti­ons­dienst für die Cloud bereit. Hybrid­um­ge­bun­gen kön­nen mit den bekann­ten Azure-Mit­teln des vir­tu­el­len Netz­wer­kes umge­setzt wer­den – zusam­men mit einem VPN-Gate­way oder der schnel­le­ren Express-Route-Ver­bin­dung zum eige­nen Rechenzentrum.

Die Bedeu­tung von Daten nimmt ste­tig zu. Völ­lig zurecht gel­ten sie heute als Roh­stoff des 21. Jahr­hun­derts. Ent­spre­chend stei­gen auch die Anfor­de­run­gen an die eigene Infrastruktur, um diese Daten auf­zu­neh­men, auf­zu­be­rei­ten und zu ver­wal­ten. Data Engi­neers und Ent­wick­ler stel­len daher immer häu­fi­ger fest, dass eine Migra­tion der On-Pre­mise-Anwen­dun­gen hin zu der Cloud mit ihrer gro­ßen Fle­xi­bi­li­tät und Ska­lier­bar­keit große Vpor­teile bie­tet und zukünf­tig fast schon unum­gäng­lich sein wird. Die SSIS-Unter­stüt­zung in ADF ist ver­füg­bar für alle Kun­den und ermög­licht hier­bei eine Lift-&-Shift-Migration. Dadurch pro­fi­tie­ren Nut­zer von einer grö­ße­ren Ska­lier­bar­keit, einer höhe­ren Ver­füg­bar­keit und gleich­zei­tig nied­ri­ge­ren Gesamt­kos­ten (TCO).
Zusätz­lich müs­sen die erfor­der­li­chen Res­sour­cen nicht selbst ver­wal­tet und ein­ge­rich­tet wer­den, da dies von ADF über­nom­men wird.

SSIS-Pakete kön­nen – ohne Pro­gram­mier­kennt­nisse – ein­fach via einer gra­fi­schen Ober­flä­che bereit­ge­stellt wer­den (alter­na­tiv kann die Bereit­stel­lung auch mit Power­Shell erfol­gen. Mit die­sem Ver­fah­ren könn­ten die Skripte para­me­tri­siert wer­den und bei einem Migra­ti­ons­pro­jekt ent­spre­chend auto­ma­ti­siert werden.

In ADF wer­den die SSIS-Pakete von der Azure-SSIS-Inte­gra­tion-Run­time ver­wal­tet.
Diese stellt eigene dedi­zierte Ser­ver (vir­tu­elle Maschi­nen in Azure) für die Aus­füh­rung bereit, wel­che auto­ma­tisch erzeugt wer­den. Mit­tels der Kno­ten­größe und der Kno­ten­an­zahl kann das Ska­lie­rungs­ver­hal­ten kon­fi­gu­riert wer­den. Für das Hos­ten des SSIS-Kata­lo­ges ist eine Azure Daten­bank erfor­der­lich. Es kann sowohl Azure-SQL als auch eine ver­wal­tete Daten­bank­in­stanz ver­wen­det werden.

Zur Aus­füh­rung der SSIS-Pakete nutzt ADF ent­spre­chende SQL-Ser­ver-Instan­zen auf den ein­zel­nen vir­tu­el­len Maschi­nen. Mit dem Azure Hybrid Bene­fit kön­nen exis­tie­rende On-Pre­mise-Lizen­zen gel­tend gemacht wer­den, um die Kos­ten zu senken.

Die in ADF bereit­ge­stell­ten SSIS-Pakete kön­nen wie andere Akti­vi­tä­ten in die Pipe­line ein­ge­bun­den wer­den. Sie pro­fi­tie­ren ent­spre­chend auch vom Trig­ger-Sys­tem und der Ablaufsteuerung.

Mit­tels eines benut­zer­de­fi­nier­ten Set­ups kön­nen Para­me­ter für die Azure-SSIS-Inte­gra­tion-Run­time bei Bedarf ange­passt und Erwei­te­run­gen instal­liert werden.

Bedingt durch die Cha­rak­te­ris­ti­ken eines Cloud­diens­tes sind tra­di­tio­nelle Lizen­sie­rungs­me­tho­den für SSIS-Kom­po­nen­ten von Dritt­her­stel­lern eher unge­eig­net. Hier­für gibt es nun ein eige­nes Lizensierungskonzept.

Zusätz­lich zu die­sen Fea­tures kann ADF auch auf die Enter­prise Edi­tion erwei­tert wer­den. Neben wei­te­ren Kon­nek­to­ren (u.a. Ora­cle, Teradata, SAP BW) wer­den auch zusätz­li­che Trans­for­ma­tio­nen bereit­ge­stellt (Fuz­zy­grup­pie­rung und Fuz­zy­su­che; Aus­drucks­ex­tra­hie­rung und Ausdruckssuche).

Fazit

Bei der Lift-&-Shift-Migration kön­nen bestehende Kennt­nisse und Fähig­kei­ten genutzt wer­den. Nach wie vor kön­nen die SSIS-Pakete mit­tels ver­trau­ter Werk­zeuge wie des SQL Ser­ver Data Tools (SSDT) und des SQL Ser­ver Manage­ment Stu­dios (SSMS) designt, ver­teilt, kon­fi­gu­riert, aus­ge­führt und über­wacht werden.

Als Cloud­dienst bie­tet ADF hier­bei deut­li­che Vor­teile im Ver­gleich zu einer On-Premise-Lösung.

Durch die Ein­bin­dung in das Azure-Öko­sys­tem kön­nen wei­tere Dienste wie HDIn­sight oder Azure Machine Lear­ning pro­blem­los ange­bun­den wer­den, um im Big-Data-Umfeld schnell Ana­ly­sen auf den exis­tie­ren­den Daten durch­füh­ren und die ent­spre­chen­den Ergeb­nisse wei­ter­ver­wen­den zu können.