Snowflake & Snowpark Python
Edycja 2026. Dogłębne spojrzenie na główną architekturę Snowflake oraz bibliotekę Snowpark Python. Odkryj, jak korzystać z DataFrames, niestandardowych UDFs, Stored Procedures, pandas on Snowflake oraz natywnego trenowania ML w Data Cloud.
Odcinki
Architektura Snowflake
4m 11sOdkryj podstawową architekturę Snowflake. Ten odcinek wyjaśnia oddzielenie warstwy obliczeniowej od przechowywania danych oraz to, jak Snowflake łączy architektury shared-disk i shared-nothing.
Wprowadzenie do Snowpark Python
3m 34sDowiedz się, jak Snowpark wprowadza język Python do Twoich danych. Omawiamy abstrakcję DataFrame oraz sposób, w jaki Snowpark tłumaczy kod w języku Python na rozproszony SQL.
Nawiązywanie sesji
3m 58sDowiedz się, jak bezpiecznie połączyć się ze Snowflake za pomocą Snowpark. Omawiamy konfiguracje Session builder, SSO w zewnętrznej przeglądarce oraz zarządzanie poświadczeniami.
Python Worksheets w Snowsight
3m 19sOdkryj, jak pisać i wykonywać kod Snowpark Python bezpośrednio w interfejsie Snowflake. Pomiń lokalną konfigurację i wykorzystaj preinstalowane pakiety Anaconda.
Tworzenie Snowpark DataFrames
3m 35sZacznij pracę z główną abstrakcją Snowpark: DataFrame. Dowiedz się, jak odwoływać się do tabel, tworzyć DataFrames z wartości dosłownych i wykorzystywać lazy evaluation.
Przekształcanie DataFrames
3m 45sOpanuj przekształcanie DataFrames w Snowpark. Odkrywamy filtrowanie, wybieranie kolumn, łączenie zbiorów danych i wyzwalanie wykonania za pomocą metod akcji.
Wywoływanie funkcji systemowych
3m 27sDowiedz się, jak wywoływać potężne, wbudowane funkcje SQL Snowflake bezpośrednio z Twoich Python DataFrames bez przepisywania logiki.
pandas on Snowflake: Zmiana paradygmatu
3m 58sOdkryj, jak uruchamiać standardowy kod pandas na ogromną skalę. Wprowadzamy wtyczkę Modin, która pozwala na natywne wykonywanie pandas wewnątrz Snowflake.
pandas on Snowflake: Hybrid Execution
4m 03sZanurz się w mechanikę Hybrid Execution w pandas on Snowflake. Dowiedz się, jak silnik płynnie przełącza się między rozproszonymi obliczeniami w chmurze a pamięcią lokalną.
Pobieranie danych zewnętrznych
3m 47sDowiedz się, jak pobierać dane z systemów zewnętrznych za pomocą Snowpark DB-API i JDBC. Wprowadź dane operacyjne bezpośrednio do swoich potoków analitycznych.
Tworzenie skalarnych UDFs
4m 09sWprowadź niestandardową logikę w języku Python do swoich zapytań SQL. Ten odcinek omawia tworzenie anonimowych i nazwanych User-Defined Functions (UDFs) w Snowpark.
Zarządzanie zależnościami dla UDFs
3m 49sDowiedz się, jak importować biblioteki firm trzecich i lokalne moduły do swoich Snowflake UDFs, używając kanału Anaconda i importów w ramach Session.
Budowanie User-Defined Table Functions
3m 53sWyjdź poza wartości skalarne. Dowiedz się, jak budować User-Defined Table Functions (UDTFs), aby zwracać wiele wierszy i kolumn z pojedynczego wejścia.
Tworzenie Stored Procedures
3m 51sZautomatyzuj swoje potoki w całości wewnątrz Snowflake. Odkrywamy tworzenie Stored Procedures do wykonywania złożonej logiki biznesowej i przepływu sterowania.
Trenowanie modeli ML w Snowflake
3m 43sOdkryj, jak bezpiecznie trenować ciężkie modele uczenia maszynowego na hurtowniach zoptymalizowanych pod kątem Snowpark, używając niestandardowych Python Stored Procedures.
Dynamiczny dostęp do plików z SnowflakeFile
3m 45sDowiedz się, jak dynamicznie przesyłać strumieniowo duże, nieustrukturyzowane pliki z internal stages bezpośrednio wewnątrz Twoich UDFs i Stored Procedures.
Testowanie Snowpark Python
3m 45sUpewnij się, że Twoje potoki danych są solidne. Omawiamy konfigurację PyTest, tworzenie fixtur Session oraz testowanie jednostkowe przekształceń DataFrames.