- Vorstellung des Sprechers
- Ziel des Webinars
Beschreibung
In diesem Webinar geben wir Ihnen einen umfassenden Überblick über die Einsatzmöglichkeiten von Databricks im Bereich Data Warehousing und ETL. Wir zeigen Ihnen, wie Sie mit Databricks nicht nur Entwicklungszeit einsparen, sondern auch die Performance Ihrer Datenpipelines optimieren können. Neben den Features für klassische Batch-ETL Verarbeitung gehen wir auch kurz auf Streaming und Analytics/ML Use Cases ein. Dabei richten wir uns sowohl an Entwickler, die tiefer in die Technologie eintauchen möchten, als auch an Entscheidungsträger, Manager und Teamleiter, die vor der Wahl einer passenden Technologie stehen.
Anmeldung
Experten
Dr. Alexander Fulst
Agenda
Begrüßung und Einführung
Databricks als Unified Analytics Plattform
- Überblick über Databricks
- Data Engineering mit Databricks
- Data Analytics und ML mit Databricks
- Integration mit anderen Services
Spark als Treiber der ETL Prozesse
- Überblick über Spark
- PySpark als einfaches Interface zu performanten Transformationen
Best Practices und Praxisbeispiele
- Modulare ETL Prozesse
- Performance Optimierung
Zusammenfassung
Q&A
Kurzinformation
Grundkenntnisse in Python und / oder Spark sind hilfreich, aber nicht erforderlich
Online Webinar
Entwickler mit wenig oder keiner Erfahrung in Spark und Entscheidungsträger die über ein Cloud DWH für Analytics Use Cases nachdenken.
Deutsch