- Vorstellung verschiedener Machine Learning Use Cases
- Allgemeines Vorgehen beim Data Mining
- Einführung in die Python-Bibliotheken Numpy und Pandas
- Übung: Praktischer Einsatz von Numpy und Pandas
- Techniken zur Data Exploration und Datenvisualisierung
- Einführung in die Python-Bibliotheken Matplotlib und Seaborn
- Übung: Datenvisualisierung mit Matplotlib und Seaborn
- Feature Engineering und Feature Preparation
- Übung: Datenaufbereitung und Feature Engineering mit Pandas
Beschreibung
Während des Seminars werden weit verbreitete Bibliotheken und Frameworks wie Pandas, Matplotlib, scikit-learn und Apache Spark vorgestellt und und in einer Vielzahl von Übungen eingesetzt. Das Seminar vermittelt Ihnen sowohl die theoretischen Grundlagen im Bereich Advanced Analytics als auch deren Anwendung.Die Referenten sind erfahrene Data Scientists mit didaktischen Fähigkeiten.
Alle Übungen werden auf einem Multi-Node-Hadoop-Cluster ausgeführt, welches in der Amazon EC2 Cloud installiert ist.
Anmeldung
Agenda
Der dritte Seminartag ist optional. Somit können Sie entweder die ersten beiden Seminartage buchen oder alle drei Seminartage.
Tag 1 - Einführung in Data Mining
Tag 2 - Machine-Learning-Methoden
- Detaillierte Besprechung wichtiger Machine Learning Algorithmen (Lineare und logistische Regression, Entscheidungsbäume, Random Forest, k‑Nearest-Neighbor-Algorithmus, k‑Means-Algorithmus)
- Einführung in die Python-Bibliothek scikit-learn
- Übung: Entwicklung einer Machine-Learning-Pipeline für Regression und binäre Klassifikation
- Vorstellung von Metriken zur Bewertung eines Machine-Learning-Modells
Tag 3 - Big Data Analysen und komplexe ML-Methoden
- Einführung in Spark und Spark SQL
- Übung: Data Preparation mit Spark SQL
- Einführung in MLlib
- Übung: Clustering mit Spark MLlib
- Advanced Machine Learning Topics: Curse of Dimensionality, Feature Selection, Imbalanced Datasets, etc.
Kurzinformation
Voraussetzungen
Notwendig ist ein Basiswissen von Python und grundlegendes mathematisches und statistisches Verständnis.
Berücksichtigen Sie bitte, dass eine Mindestteilnehmerzahl von 4 Personen vorgesehen ist. Ansonsten kann das Seminar nicht stattfinden.
Methode
Präsenzseminar:
Das Seminar wird aus Vortrag, Diskussionsrunden sowie praktischen Übungen bestehen. Viele Beispiele aus der Praxis verdeutlichen die Theorie.
Zielgruppe
Das Seminar richtet sich an (angehende) Data Scientists und Data Analysts, die sich die wichtigsten Basiskenntnisse erarbeiten wollen, um valide Modelle mit Hilfe unterschiedlicher Verfahren des Machine Learnings entwicklen zu können.
Sprachen
Seminar: Deutsch
Stornierung
Bei Stornierung bis zu 14 Tage vor Veranstaltungsbeginn erheben wir eine Bearbeitungsgebühr von 50% der Gebühr. Bei späteren Absagen wird der gesamte Beitrag fällig.
Sollten wir aus wichtigem Grund (z. B. Erkrankung des/der Referenten) gezwungen sein, den Kurs abzusagen, so teilen wir Ihnen dieses umgehend mit. Wir werden Ihnen in diesem Fall einen Ersatztermin anbieten. Passt dieser nicht zu Ihrer Terminplanung, erhalten Sie die bereits gezahlte Workshopgebühr in voller Höhe zurück. Darüber hinausgehende Ansprüche bestehen nicht.
Möchten Sie
als Team teilnehmen?
Melden Sie drei Teilnehmer an und erhalten Sie 10% Rabatt ab dem dritten Teilnehmer.
Workshoppreis
Seminar-Optionen
Der dritte Seminartag ist optional. Somit können Sie entweder die ersten beiden Seminartage buchen oder alle drei Seminartage.
Die Preise sind Nettopreise und verstehen sich zuzüglich der zur Zeit gültigen Mehrwertsteuer.
Der Preis für dieses Seminar beträgt: