Snowflake hat gerade die Veröffentlichung von Dynamic Tables angekündigt, einer revolutionären Funktion zur Vereinfachung deklarativer Datentransformationspipelines.
Was ist neu?
Erst vor wenigen Tagen hat Snowflake außerdem interessante neue Funktionen speziell für Data Engineers angekündigt, wie das Lesen von Dateien mit einem Java‑, Scala- oder Python-Funktions- oder Prozedur-Handler und die Unterstützung von Snowpipe-Streaming-Replikation.
Snowflake bietet nun grundlegende Elemente für ein nahtloses Data Engineering, indem es dynamische Tabellen bereitstellt. Sie bieten einen rationalisierten und effizienten Ansatz für die Umwandlung von Daten zur Verwendung, wodurch die Notwendigkeit einer komplizierten Aufgabenabfolge, Abhängigkeitsüberwachung und Zeitplanung entfällt. Durch die Definition des gewünschten Endzustands der Transformation mithilfe dynamischer Tabellen ist Snowflake in der Lage, die Feinheiten der Pipeline zu verwalten.
Bei der Erstellung einer dynamischen Tabelle definieren Sie die Abfrage, die zur Transformation von Daten aus einer oder mehreren Basis- oder dynamischen Tabellen verwendet wird. Ein automatisierter Aktualisierungsprozess ist dann für die regelmäßige Ausführung dieser Abfrage und die Aktualisierung der dynamischen Tabelle mit allen an den Basistabellen vorgenommenen Änderungen verantwortlich.
Im Vergleich zu Strömen/Aufgaben nutzen dynamische Tabellen diesen automatisierten Prozess, um die an den Basistabellen vorgenommenen Änderungen zu berechnen und diese Änderungen in die dynamische Tabelle einzubringen. Der Prozess nutzt die Rechenressourcen des zugehörigen Warehouse, die Sie der dynamischen Tabelle zuweisen.
Bei der Erstellung einer dynamischen Tabelle haben Sie die Möglichkeit, eine gewünschte „Frische“ für die Daten anzugeben, die die Zielverzögerung darstellt. Für tiefere Einblicke sollten Sie die unten verlinkte offizielle Dokumentation verwenden.
Anwendungsfälle für die Verwendung dynamischer Tabellen könnten sein:
- Das Schreiben von eigenem Code, die Verfolgung von Datenabhängigkeiten und die Verwaltung von Datenaktualisierungen entfallen.
- Verringerung der Komplexität von Datenströmen und Aufgaben.
- Keine feinkörnige Kontrolle über den Zeitplan der Aktualisierungen.
- Materialisierung der Ergebnisse einer Abfrage von mehreren Basistabellen.
Fazit
Es handelt sich also um eine großartige neue Funktion, die die Datenaufbereitung und ‑transformation im Rahmen von ELT-Prozessen in Ihrem Snowflake Data Warehouse vereinfachen kann und eine gute Alternative zu Tasks darstellt.
Erfahren Sie hier mehr über Lösungen im Bereich Snowflake oder besuchen Sie eines unserer kostenlosen Webinare.
Quelle: Snowflake