Snowflake & Snowpark Python
Ausgabe 2026. Ein tiefer Einblick in die Kernarchitektur von Snowflake und die Snowpark Python-Bibliothek. Entdecke, wie du DataFrames, benutzerdefinierte UDFs, Stored Procedures, pandas on Snowflake und ML-Training nativ in der Data Cloud nutzen kannst.
Episoden
Die Snowflake-Architektur
4m 10sEntdecke die grundlegende Architektur von Snowflake. Diese Episode erklärt die Trennung von Compute und Storage und wie Snowflake Shared-Disk- und Shared-Nothing-Architekturen kombiniert.
Einführung in Snowpark Python
4m 01sErfahre, wie Snowpark Python zu deinen Daten bringt. Wir behandeln die DataFrame-Abstraktion und wie Snowpark Python-Code in verteiltes SQL übersetzt.
Eine Session aufbauen
3m 54sErfahre, wie du dich mit Snowpark sicher mit Snowflake verbindest. Wir diskutieren Session-Builder-Konfigurationen, externes Browser-SSO und die Verwaltung von Anmeldeinformationen.
Python Worksheets in Snowsight
3m 32sEntdecke, wie du Snowpark Python direkt in der Snowflake-UI schreiben und ausführen kannst. Überspringe das lokale Setup und nutze vorinstallierte Anaconda-Pakete.
Snowpark DataFrames erstellen
3m 38sMach dich mit der Kernabstraktion von Snowpark vertraut: dem DataFrame. Lerne, wie du Tabellen referenzierst, DataFrames aus Literalwerten erstellst und Lazy Evaluation nutzt.
DataFrames transformieren
3m 45sMeistere DataFrame-Transformationen in Snowpark. Wir untersuchen das Filtern, das Auswählen von Spalten, das Zusammenführen von Datensätzen und das Auslösen der Ausführung mit Action-Methoden.
Systemfunktionen aufrufen
3m 33sErfahre, wie du die leistungsstarken integrierten SQL-Funktionen von Snowflake direkt aus deinen Python DataFrames aufrufst, ohne Logik neu schreiben zu müssen.
pandas on Snowflake: Der Paradigmenwechsel
3m 45sEntdecke, wie du Standard-pandas-Code in massivem Maßstab ausführen kannst. Wir stellen das Modin-Plugin vor, das die native Ausführung von pandas innerhalb von Snowflake ermöglicht.
pandas on Snowflake: Hybrid Execution
4m 08sTauche ein in die Mechanik der Hybrid Execution in pandas on Snowflake. Erfahre, wie die Engine nahtlos zwischen verteiltem Cloud-Compute und lokalem Arbeitsspeicher wechselt.
Externe Daten aufnehmen
4m 00sErfahre, wie du Daten aus externen Systemen mithilfe der Snowpark DB-API und JDBC aufnimmst. Bringe operative Daten direkt in deine analytischen Pipelines.
Skalare UDFs erstellen
3m 59sBringe benutzerdefinierte Python-Logik in deine SQL-Abfragen. Diese Episode behandelt die Erstellung anonymer und benannter User-Defined Functions (UDFs) in Snowpark.
Dependency Management für UDFs
4m 09sErfahre, wie du Drittanbieter-Bibliotheken und lokale Module über den Anaconda-Kanal und Session-Importe in deine Snowflake UDFs importierst.
User-Defined Table Functions erstellen
3m 46sGehe über skalare Werte hinaus. Lerne, wie du User-Defined Table Functions (UDTFs) erstellst, um mehrere Zeilen und Spalten aus einer einzigen Eingabe zurückzugeben.
Stored Procedures verfassen
3m 58sAutomatisiere deine Pipelines vollständig innerhalb von Snowflake. Wir untersuchen die Erstellung von Stored Procedures zur Ausführung komplexer Geschäftslogik und zur Steuerung des Ablaufs.
ML-Modelle in Snowflake trainieren
3m 56sEntdecke, wie du anspruchsvolle Machine-Learning-Modelle sicher auf Snowpark-optimierten Warehouses mithilfe von benutzerdefinierten Python Stored Procedures trainierst.
Dynamischer Dateizugriff mit SnowflakeFile
3m 51sErfahre, wie du große unstrukturierte Dateien dynamisch aus internen Stages direkt innerhalb deiner UDFs und Stored Procedures streamst.
Snowpark Python testen
4m 05sStelle sicher, dass deine Daten-Pipelines robust sind. Wir behandeln die Einrichtung von PyTest, die Erstellung von Session-Fixtures und das Unit-Testing von DataFrame-Transformationen.