Data Scientist Basis-Training mit Python und Spark MLlib

Dieses dreitägige Grundlagen-Seminar gibt angehenden Data Scientists und Data Analysts neben der Modellbildung einen Einblick in die Bereiche Data Exploration, Feature Preparation und Visualisierung.

Seminare

Beschreibung

Während des Seminars werden weit verbreitete Bibliotheken und Frameworks wie Pandas, Matplotlib, scikit-learn und Apache Spark vorgestellt und und in einer Vielzahl von Übungen eingesetzt. Das Seminar vermittelt Ihnen sowohl die theoretischen Grundlagen im Bereich Advanced Analytics als auch deren Anwendung.Die Referenten sind erfahrene Data Scientists mit didaktischen Fähigkeiten.

Alle Übungen werden auf einem Multi-Node-Hadoop-Cluster ausgeführt, welches in der Amazon EC2 Cloud installiert ist.

Anmeldung

Datum:

Standort:

Preis:

25/07/2023 - 26/07/2023

Baden-Dättwil (CH)

2.100,00 CHF (zzgl. MwSt.)

25/07/2023 - 27/07/2023

Baden-Dättwil (CH)

2.990.00 CHF (zzgl. MwSt.)

29/08/2023 - 30/08/2023

Münster (D)

1.750,00 EUR (zzgl. MwSt.)

29/08/2023 - 31/08/2023

Münster (D)

2.610,00 EUR (zzgl. MwSt.)

Jetzt registrieren

Agenda

Der dritte Seminartag ist optional. Somit können Sie entweder die ersten beiden Seminartage buchen oder alle drei Seminartage.

Vorstellung verschiedener Machine Learning Use Cases
Allgemeines Vorgehen beim Data Mining
Einführung in die Python-Bibliotheken Numpy und Pandas
Übung: Praktischer Einsatz von Numpy und Pandas
Techniken zur Data Exploration und Datenvisualisierung
Einführung in die Python-Bibliotheken Matplotlib und Seaborn
Übung: Datenvisualisierung mit Matplotlib und Seaborn
Feature Engineering und Feature Preparation
Übung: Datenaufbereitung und Feature Engineering mit Pandas

Detaillierte Besprechung wichtiger Machine Learning Algorithmen (Lineare und logistische Regression, Entscheidungsbäume, Random Forest, k‑Nearest-Neighbor-Algorithmus, k‑Means-Algorithmus)
Einführung in die Python-Bibliothek scikit-learn
Übung: Entwicklung einer Machine-Learning-Pipeline für Regression und binäre Klassifikation
Vorstellung von Metriken zur Bewertung eines Machine-Learning-Modells

Einführung in Spark und Spark SQL
Übung: Data Preparation mit Spark SQL
Einführung in MLlib
Übung: Clustering mit Spark MLlib
Advanced Machine Learning Topics: Curse of Dimensionality, Feature Selection, Imbalanced Datasets, etc.

Kurzinformation

Voraussetzungen

Notwendig ist ein Basiswissen von Python und grundlegendes mathematisches und statistisches Verständnis.
Berücksichtigen Sie bitte, dass eine Mindestteilnehmerzahl von 4 Personen vorgesehen ist. Ansonsten kann das Seminar nicht stattfinden.

Methode

Präsenzseminar:
Das Seminar wird aus Vortrag, Diskussionsrunden sowie praktischen Übungen bestehen. Viele Beispiele aus der Praxis verdeutlichen die Theorie.

Zielgruppe

Das Seminar richtet sich an (angehende) Data Scientists und Data Analysts, die sich die wichtigsten Basiskenntnisse erarbeiten wollen, um valide Modelle mit Hilfe unterschiedlicher Verfahren des Machine Learnings entwicklen zu können.

Sprachen

Seminar: Deutsch

Stornierung

Bei Stornierung bis zu 14 Tage vor Veranstaltungsbeginn erheben wir eine Bearbeitungsgebühr von 50% der Gebühr. Bei späteren Absagen wird der gesamte Beitrag fällig.

Sollten wir aus wichtigem Grund (z. B. Erkrankung des/der Referenten) gezwungen sein, den Kurs abzusagen, so teilen wir Ihnen dieses umgehend mit. Wir werden Ihnen in diesem Fall einen Ersatztermin anbieten. Passt dieser nicht zu Ihrer Terminplanung, erhalten Sie die bereits gezahlte Workshopgebühr in voller Höhe zurück. Darüber hinausgehende Ansprüche bestehen nicht.

Möchten Sie
als Team teilnehmen?

Melden Sie drei Teilnehmer an und erhalten Sie 10% Rabatt ab dem dritten Teilnehmer.

Standort

Baden-Dättwil (CH)

Anfahrtsbeschreibung finden Sie hier.

Münster (D)

Anfahrtsbeschreibung finden Sie hier.

Workshoppreis

Seminar-Optionen
Der dritte Seminartag ist optional. Somit können Sie entweder die ersten beiden Seminartage buchen oder alle drei Seminartage.
Die Preise sind Nettopreise und verstehen sich zuzüglich der zur Zeit gültigen Mehrwertsteuer.
Der Preis für dieses Seminar beträgt:

Workshopdauer

2 Tage

EUR 1.750

CHF 2.100

3 Tage

EUR 2.610

CHF 2.990

top

Akzeptieren
Name	YouTube
Anbieter	Google LLC
Zweck	Diese Webseite verwendet Youtube zu Marketingzwecken. Die Daten werden an einen Server in den USA übertragen und dort gespeichert. Die personenbezogenen Daten werden auf Grundlage des Art. 46 und/oder Art. 49 Abs. 1 lit. a) DSGVO übermittelt.
Laufzeit	Daten werden gelöscht, sobald sie für die Bearbeitung nicht mehr benötigt werden.
Weiterführende Infos	https://policies.google.com/privacy

Akzeptieren
Name	hellotrust
Anbieter	Keyed GmbH
Zweck	hellotrust speichert den Zustimmungsstatus des Benutzers für Cookies auf der aktuellen Domain.
Laufzeit	Daten werden gelöscht, sobald sie für die Bearbeitung nicht mehr benötigt werden.
Weiterführende Infos	https://hellotrust.de/datenschutz

Akzeptieren
Name	Google Analytics
Anbieter	Google LLC
Zweck	Diese Webseite verwendet Google Analytics zur Analyse der Websitebenutzung durch Nutzer. Die Daten werden an einen Server von Google in den USA übertragen und dort gespeichert. Die personenbezogenen Daten werden auf Grundlage des Art. 46 und/oder Art. 49 Abs. 1 lit. a) DSGVO übermittelt.
Laufzeit	Daten werden gelöscht, sobald sie für die Bearbeitung nicht mehr benötigt werden. In der Regel werden die Cookies von Google für eine Dauer von 2 Jahren gespeichert.
Weiterführende Infos	https://policies.google.com/privacy