Data Sci­en­tist Basis-Trai­ning mit Python und Spark MLlib


Die­ses drei­tä­gige Grund­la­gen-Semi­nar gibt ange­hen­den Data Sci­en­tists und Data Ana­lysts neben der Modell­bil­dung einen Ein­blick in die Berei­che Data Explo­ra­tion, Fea­ture Pre­pa­ra­tion und Visualisierung.
Semi­nare

Beschrei­bung


Wäh­rend des Semi­nars wer­den weit ver­brei­tete Biblio­the­ken und Frame­works wie Pan­das, Mat­plot­lib, sci­kit-learn und Apa­che Spark vor­ge­stellt und und in einer Viel­zahl von Übun­gen ein­ge­setzt. Das Semi­nar ver­mit­telt Ihnen sowohl die theo­re­ti­schen Grund­la­gen im Bereich Advan­ced Ana­ly­tics als auch deren Anwendung.Die Refe­ren­ten sind erfah­rene Data Sci­en­tists mit didak­ti­schen Fähigkeiten.

Alle Übun­gen wer­den auf einem Multi-Node-Hadoop-Clus­ter aus­ge­führt, wel­ches in der Ama­zon EC2 Cloud instal­liert ist.



Anmel­dung


Datum:

Standort:

Preis:

25/07/2023 - 26/07/2023


Baden-Dättwil (CH)


2.100,00 CHF (zzgl. MwSt.)

25/07/2023 - 27/07/2023


Baden-Dättwil (CH)


2.990.00 CHF (zzgl. MwSt.)

29/08/2023 - 30/08/2023


Münster (D)


1.750,00 EUR (zzgl. MwSt.)

29/08/2023 - 31/08/2023


Münster (D)


2.610,00 EUR (zzgl. MwSt.)

Agenda


Der dritte Seminartag ist optional. Somit können Sie entweder die ersten beiden Seminartage buchen oder alle drei Seminartage.


Tag 1 - Einführung in Data Mining

  • Vor­stel­lung ver­schie­de­ner Machine Lear­ning Use Cases
  • All­ge­mei­nes Vor­ge­hen beim Data Mining
  • Ein­füh­rung in die Python-Biblio­the­ken Numpy und Pandas
  • Übung: Prak­ti­scher Ein­satz von Numpy und Pandas
  • Tech­ni­ken zur Data Explo­ra­tion und Datenvisualisierung
  • Ein­füh­rung in die Python-Biblio­the­ken Mat­plot­lib und Seaborn
  • Übung: Daten­vi­sua­li­sie­rung mit Mat­plot­lib und Seaborn
  • Fea­ture Engi­nee­ring und Fea­ture Preparation
  • Übung: Daten­auf­be­rei­tung und Fea­ture Engi­nee­ring mit Pandas
Tag 2 - Machine-Learning-Methoden

  • Detail­lierte Bespre­chung wich­ti­ger Machine Lear­ning Algo­rith­men (Lineare und logis­ti­sche Regres­sion, Ent­schei­dungs­bäume, Ran­dom Forest, k‑Nea­rest-Neigh­bor-Algo­rith­mus, k‑Me­ans-Algo­rith­mus)
  • Ein­füh­rung in die Python-Biblio­thek scikit-learn
  • Übung: Ent­wick­lung einer Machine-Lear­ning-Pipe­line für Regres­sion und binäre Klassifikation
  • Vor­stel­lung von Metri­ken zur Bewer­tung eines Machine-Learning-Modells
Tag 3 - Big Data Analysen und komplexe ML-Methoden

  • Ein­füh­rung in Spark und Spark SQL
  • Übung: Data Pre­pa­ra­tion mit Spark SQL
  • Ein­füh­rung in MLlib
  • Übung: Clus­te­ring mit Spark MLlib
  • Advan­ced Machine Lear­ning Topics: Curse of Dimen­sio­na­lity, Fea­ture Sel­ec­tion, Imba­lan­ced Data­sets, etc.


Kurz­in­for­ma­tion


Vor­aus­set­zun­gen



Not­wen­dig ist ein Basis­wis­sen von Python und grund­le­gen­des mathe­ma­ti­sches und sta­tis­ti­sches Verständnis.
Berück­sich­ti­gen Sie bitte, dass eine Min­dest­teil­neh­mer­zahl von 4 Per­so­nen vor­ge­se­hen ist. Ansons­ten kann das Semi­nar nicht stattfinden.


Methode



Prä­senz­se­mi­nar:
Das Semi­nar wird aus Vor­trag, Dis­kus­si­ons­run­den sowie prak­ti­schen Übun­gen bestehen. Viele Bei­spiele aus der Pra­xis ver­deut­li­chen die Theorie.


Ziel­gruppe



Das Semi­nar rich­tet sich an (ange­hende) Data Sci­en­tists und Data Ana­lysts, die sich die wich­tigs­ten Basis­kennt­nisse erar­bei­ten wol­len, um valide Modelle mit Hilfe unter­schied­li­cher Ver­fah­ren des Machine Lear­nings ent­wick­len zu können.


Sprachen



Semi­nar: Deutsch


Stornierung



Bei Stor­nie­rung bis zu 14 Tage vor Ver­an­stal­tungs­be­ginn erhe­ben wir eine Bear­bei­tungs­ge­bühr von 50% der Gebühr. Bei spä­te­ren Absa­gen wird der gesamte Bei­trag fällig.


Soll­ten wir aus wich­ti­gem Grund (z. B. Erkran­kung des/der Refe­ren­ten) gezwun­gen sein, den Kurs abzu­sa­gen, so tei­len wir Ihnen die­ses umge­hend mit. Wir wer­den Ihnen in die­sem Fall einen Ersatz­ter­min anbie­ten. Passt die­ser nicht zu Ihrer Ter­min­pla­nung, erhal­ten Sie die bereits gezahlte Work­shop­ge­bühr in vol­ler Höhe zurück. Dar­über hin­aus­ge­hende Ansprü­che bestehen nicht.




Möch­ten Sie
als Team teilnehmen?


Mel­den Sie drei Teil­neh­mer an und erhal­ten Sie 10% Rabatt ab dem drit­ten Teilnehmer.

Stand­ort


Baden-Dättwil (CH)


Anfahrtsbeschreibung finden Sie hier.

Münster (D)


Anfahrtsbeschreibung finden Sie hier.

Work­shoppreis


Semi­nar-Optio­nen
Der dritte Semi­nar­tag ist optio­nal. Somit kön­nen Sie ent­we­der die ers­ten bei­den Semi­nar­tage buchen oder alle drei Seminartage.
Die Preise sind Net­to­preise und ver­ste­hen sich zuzüg­lich der zur Zeit gül­ti­gen Mehrwertsteuer.
Der Preis für die­ses Semi­nar beträgt:


Work­shop­dauer
2 Tage

EUR 1.750

CHF 2.100
3 Tage

EUR 2.610

CHF 2.990


top