Snowflake & Snowpark Python
Édition 2026. Une plongée au cœur de l'architecture de Snowflake et de la bibliothèque Snowpark Python. Découvrez comment utiliser les DataFrames, les UDFs personnalisées, les Stored Procedures, pandas on Snowflake et l'entraînement ML nativement dans le Data Cloud.
Épisodes
L'architecture de Snowflake
3m 19sDécouvrez l'architecture fondamentale de Snowflake. Cet épisode explique la séparation du calcul et du stockage, et comment Snowflake combine les architectures shared-disk et shared-nothing.
Introduction à Snowpark Python
3m 37sDécouvrez comment Snowpark apporte Python à vos données. Nous abordons l'abstraction des DataFrames et la manière dont Snowpark traduit le code Python en SQL distribué.
Établir une Session
3m 33sApprenez à vous connecter de manière sécurisée à Snowflake avec Snowpark. Nous discutons des configurations du Session builder, du SSO via navigateur externe et de la gestion des identifiants.
Les Python Worksheets dans Snowsight
3m 16sDécouvrez comment écrire et exécuter du code Snowpark Python directement dans l'interface utilisateur de Snowflake. Évitez la configuration locale et utilisez les paquets Anaconda préinstallés.
Construire des DataFrames Snowpark
3m 15sFamiliarisez-vous avec l'abstraction principale de Snowpark : le DataFrame. Apprenez à référencer des tables, à créer des DataFrames à partir de valeurs littérales et à tirer parti de la lazy evaluation.
Transformer des DataFrames
3m 21sMaîtrisez les transformations de DataFrames dans Snowpark. Nous explorons le filtrage, la sélection de colonnes, les jointures de jeux de données et le déclenchement de l'exécution avec les méthodes d'action.
Appeler des fonctions système
3m 16sApprenez à invoquer les puissantes fonctions SQL intégrées de Snowflake directement depuis vos DataFrames Python sans réécrire la logique.
pandas on Snowflake : Le changement de paradigme
3m 01sDécouvrez comment exécuter du code pandas standard à grande échelle. Nous présentons le plugin Modin qui permet l'exécution de pandas nativement dans Snowflake.
pandas on Snowflake : L'exécution hybride
3m 42sPlongez dans les mécanismes de l'Hybrid Execution dans pandas on Snowflake. Découvrez comment le moteur bascule de manière transparente entre le calcul distribué dans le cloud et la mémoire locale.
Ingérer des données externes
3m 11sApprenez à ingérer des données provenant de systèmes externes en utilisant la DB-API de Snowpark et JDBC. Intégrez vos données opérationnelles directement dans vos pipelines analytiques.
Créer des UDFs scalaires
3m 44sApportez une logique Python personnalisée à vos requêtes SQL. Cet épisode couvre la création de User-Defined Functions (UDFs) anonymes et nommées dans Snowpark.
Gestion des dépendances pour les UDFs
3m 37sApprenez à importer des bibliothèques tierces et des modules locaux dans vos UDFs Snowflake en utilisant le canal Anaconda et les imports de session.
Créer des User-Defined Table Functions
3m 14sAllez au-delà des valeurs scalaires. Apprenez à construire des User-Defined Table Functions (UDTFs) pour retourner plusieurs lignes et colonnes à partir d'une seule entrée.
Créer des Stored Procedures
3m 38sAutomatisez vos pipelines entièrement dans Snowflake. Nous explorons la création de Stored Procedures pour exécuter une logique métier complexe et contrôler le flux d'exécution.
Entraîner des modèles ML dans Snowflake
3m 28sDécouvrez comment entraîner des modèles de machine learning lourds en toute sécurité sur des warehouses optimisés pour Snowpark en utilisant des Stored Procedures Python personnalisées.
Accès dynamique aux fichiers avec SnowflakeFile
3m 24sApprenez à streamer dynamiquement de gros fichiers non structurés depuis des internal stages directement dans vos UDFs et Stored Procedures.
Tester Snowpark Python
3m 22sAssurez-vous de la robustesse de vos pipelines de données. Nous couvrons la configuration de PyTest, la création de fixtures de Session et les tests unitaires des transformations de DataFrames.