Ein Snow­flake-Datei­for­mat kap­selt Infor­ma­tio­nen über Daten­da­teien, wie z. B. den Datei­typ (CSV, JSON usw.) und For­ma­tie­rungs­op­tio­nen, die für jeden Typ spe­zi­fisch sind, der für das Bulk Loading/Dunloading ver­wen­det wird.

Vor­aus­set­zung ist: Snow­flake-Test­konto mit Object-Lese-/Schreib­zu­griff und SQL-Kennt­nisse sind erfor­der­lich. Ein Kon­zept für das Laden und Ent­la­den von Daten in Snow­flake ist von Vor­teil, aber nicht zwin­gend erfor­der­lich. Mit Snow­flake Web UI in der Lage, Daten in Tabelle(n) zu laden.

Unter­stützte Datei­for­mate: Auf die fol­gen­den in Snow­flake unter­stütz­ten Datei­for­mate kann von Snow­flake Stages aus zuge­grif­fen wer­den (siehe unten).

Wie wird ein Datei­for­mat erstellt: Das Datei­for­mat kann mit zwei ver­schie­de­nen Metho­den erstellt wer­den: mit Snow­flake Web UI und mit SQL-Befehlen.

Aus­zu­füh­rende Schritte: Sie kön­nen die fol­gen­den Schritte mit Ihren bestehen­den Objek­ten in Snow­flake durch­füh­ren. Es gibt jedoch auch andere Mög­lich­kei­ten zur Ver­wen­dung des Datei­for­mats, die von der Ver­wen­dung und den Anfor­de­run­gen abhän­gen. Der SnowSQL-Befehls­zei­len-Cli­ent ist eine wei­tere Mög­lich­keit, SQL-Anwei­sun­gen aus­zu­füh­ren, und wir müs­sen SnowSQL installieren.

Unter­stützte SQL-Befehle: Häu­fig ver­wen­dete Befehle sind create, alter, drop, show & describe. Wer­fen wir einen kur­zen Blick auf die Kodierung.

Im Fol­gen­den wer­den wir die ver­schie­de­nen Arten von for­mat­Ty­pe­Op­ti­ons erör­tern, die je nach ange­ge­be­nem Datei­typ eine oder meh­rere der fol­gen­den for­mat­spe­zi­fi­schen Optio­nen ent­hal­ten kön­nen, wie unten ange­ge­ben. Ich bin sicher, dass es Ihnen sehr hel­fen wird.

For­mat-Typ-Optio­nen (for­mat­Ty­pe­Op­ti­ons):

Table # 1 — File For­mat of Type = CSV
Table # 2— File For­mat of Type = CSV
Table # 3— File For­mat of Type = JSON
Table # 4— File For­mat of Type = AVRO & ORC
Table # 5— File For­mat of Type = PARQUET & XML

Fazit: Ich danke Ihnen für die Lek­türe und nehme an, dass die­ser Blog Ihnen hel­fen wird, das Datei­for­mat object und seine Bedeu­tung für das Laden und Ent­la­den von Daten zu ver­ste­hen. Die­ser Pro­zess spielt eine wich­tige Rolle in den Anfangs­pha­sen des ETL-Prozesses.

Quelle: medium