Mastering Modern Pandas
v3.0 — Édition 2026. Maîtrisez les abstractions fondamentales et les capacités modernes de pandas 3.0 en 2026. Découvrez l'alignement des données, le Copy-on-Write, l'intégration de PyArrow, la maîtrise des séries temporelles et les stratégies pour mettre à l'échelle les jeux de données out-of-core.
Épisodes
L'abstraction fondamentale : DataFrames et alignement des labels
3m 26sNous explorons les modèles mentaux fondateurs de pandas : la Series et le DataFrame. Vous apprendrez pourquoi l'alignement intrinsèque des labels est la fonctionnalité phare qui évite les désastres liés aux décalages de lignes.
La révolution du Copy-on-Write
3m 35sDécouvrez le changement architectural le plus important du pandas moderne : le Copy-on-Write. Vous apprendrez comment le CoW élimine les mutations imprévisibles et optimise l'utilisation de la mémoire.
La salle des machines PyArrow
3m 32sPandas n'est plus uniquement propulsé par NumPy. Vous apprendrez comment tirer parti du backend PyArrow pour une prise en charge native des données manquantes et des économies de mémoire incroyables sur les chaînes de caractères.
L'ingestion de données moderne
3m 18sNous abordons les stratégies d'I/O efficaces pour les grands jeux de données. Vous apprendrez comment ingérer des fichiers massifs de manière sélective et directement dans des structures mémoire hautement optimisées.
Algèbre relationnelle : Merge et Join
3m 19sNous explorons comment unifier des jeux de données disparates en utilisant l'algèbre relationnelle. Vous apprendrez à exécuter des jointures optimisées de type SQL directement dans pandas.
Le pattern Split-Apply-Combine
3m 19sDébloquez la véritable puissance de l'objet GroupBy. Vous apprendrez comment aller au-delà des simples moyennes pour effectuer des transformations et des filtrages complexes spécifiques aux groupes.
La maîtrise des séries temporelles
3m 39sNous plongeons dans la domination incontestée de pandas dans l'analyse des séries temporelles. Vous apprendrez comment tirer parti du DatetimeIndex et du resampling natif pour les données à haute fréquence.
Mise à l'échelle pour les jeux de données Out-of-Core
3m 59sNous nous attaquons aux limites de la RAM de votre machine. Vous apprendrez comment traiter des jeux de données considérablement plus grands que la mémoire en utilisant le chunking pur de pandas.