Snowflake & Snowpark Python
Edizione 2026. Un'analisi approfondita dell'architettura di base di Snowflake e della libreria Snowpark Python. Scopri come utilizzare DataFrames, UDFs personalizzate, Stored Procedures, pandas on Snowflake e l'addestramento ML nativamente nel Data Cloud.
Episodi
L'architettura di Snowflake
3m 42sScopri l'architettura fondamentale di Snowflake. Questo episodio spiega la separazione tra calcolo e archiviazione, e come Snowflake combina le architetture shared-disk e shared-nothing.
Introduzione a Snowpark Python
3m 25sScopri come Snowpark porta Python ai tuoi dati. Trattiamo l'astrazione dei DataFrame e come Snowpark traduce il codice Python in SQL distribuito.
Stabilire una Session
3m 39sScopri come connetterti in modo sicuro a Snowflake utilizzando Snowpark. Discutiamo le configurazioni del Session builder, l'SSO tramite browser esterno e la gestione delle credenziali.
Python Worksheets in Snowsight
3m 26sScopri come scrivere ed eseguire Snowpark Python direttamente all'interno della UI di Snowflake. Salta la configurazione locale e utilizza i pacchetti Anaconda preinstallati.
Costruire Snowpark DataFrames
3m 28sInizia con l'astrazione principale di Snowpark: il DataFrame. Scopri come fare riferimento alle tabelle, creare DataFrames da valori letterali e sfruttare la lazy evaluation.
Trasformare i DataFrames
3m 37sPadroneggia le trasformazioni dei DataFrame in Snowpark. Esploriamo il filtraggio, la selezione delle colonne, il join dei dataset e l'avvio dell'esecuzione con gli action methods.
Chiamare le System Functions
3m 23sScopri come invocare le potenti funzioni SQL integrate di Snowflake direttamente dai tuoi DataFrames Python senza riscrivere la logica.
pandas on Snowflake: Il cambio di paradigma
3m 37sScopri come eseguire codice pandas standard su larga scala. Introduciamo il plugin Modin che consente l'esecuzione di pandas nativamente all'interno di Snowflake.
pandas on Snowflake: Hybrid Execution
3m 38sImmergiti nei meccanismi della Hybrid Execution in pandas on Snowflake. Scopri come il motore passa senza interruzioni dal calcolo cloud distribuito alla memoria locale.
Ingestione di dati esterni
3m 36sScopri come ingerire dati da sistemi esterni utilizzando la DB-API di Snowpark e JDBC. Porta i dati operativi direttamente nelle tue pipeline analitiche.
Creare UDFs scalari
3m 57sPorta la logica Python personalizzata nelle tue query SQL. Questo episodio illustra la creazione di User-Defined Functions (UDFs) anonime e nominate in Snowpark.
Gestione delle dipendenze per le UDFs
3m 55sScopri come importare librerie di terze parti e moduli locali nelle tue UDFs di Snowflake utilizzando il canale Anaconda e i session imports.
Costruire User-Defined Table Functions
3m 22sVai oltre i valori scalari. Scopri come costruire User-Defined Table Functions (UDTFs) per restituire più righe e colonne da un singolo input.
Creare Stored Procedures
3m 45sAutomatizza le tue pipeline interamente all'interno di Snowflake. Esploriamo la creazione di Stored Procedures per eseguire logiche di business complesse e flussi di controllo.
Addestramento di modelli ML in Snowflake
3m 51sScopri come addestrare modelli di machine learning pesanti in modo sicuro su warehouse ottimizzati per Snowpark utilizzando Stored Procedures Python personalizzate.
Accesso dinamico ai file con SnowflakeFile
3m 45sScopri come trasmettere in streaming file non strutturati di grandi dimensioni dinamicamente dagli internal stages direttamente all'interno delle tue UDFs e Stored Procedures.
Testare Snowpark Python
3m 53sAssicurati che le tue pipeline di dati siano robuste. Trattiamo la configurazione di PyTest, la creazione di Session fixtures e gli unit test delle trasformazioni dei DataFrame.