Biopython Fundamentals
v1.87 — Edizione 2026. Una guida completa in 18 episodi sull'uso di Biopython (v1.87 - 2026) per l'analisi delle sequenze, il parsing di formati di dati biologici, l'esecuzione di BLAST, la gestione di strutture 3D, alberi filogenetici e molto altro.
Episodi
Introduzione a Biopython e all'oggetto Seq
3m 33sScopri le fondamenta di Biopython: l'oggetto Seq. Esploriamo come gli oggetti sequenza differiscano dalle stringhe standard di Python e impariamo a eseguire operazioni biologiche come il reverse complement e la traduzione.
Dati di sequenza arricchiti: l'oggetto SeqRecord
4m 41sImpara ad avvolgere le sequenze in ricchi metadati usando l'oggetto SeqRecord. Vedremo come identificatori, nomi, descrizioni e annotazioni sotto forma di dizionario vengano memorizzati insieme alla sequenza grezza.
Leggere e scrivere file con SeqIO
3m 31sPadroneggia le conversioni di file di sequenza e l'elaborazione batch con Bio.SeqIO. Questo episodio spiega la differenza tra la lettura di file a singolo record e il parsing di dataset multi-record.
Estrarre geni con SeqFeature
3m 34sImmergiti nel complesso mondo delle feature di sequenza. Spieghiamo come Biopython rappresenta le coordinate geniche, i filamenti e le posizioni fuzzy utilizzando l'oggetto SeqFeature.
Allineamento Pairwise di sequenze
3m 28sImpara a confrontare due sequenze direttamente utilizzando il modulo Bio.Align. Discutiamo del PairwiseAligner, dei punteggi di sostituzione e delle penalità per i gap (gap penalties) sia per gli allineamenti globali che locali.
Gestire gli allineamenti multipli di sequenze
4m 09sPassa dagli allineamenti pairwise a quelli multipli. Questo episodio copre il parsing dei file di allineamento con AlignIO e come trattare gli allineamenti come array 2D per estrarre colonne specifiche.
Interrogare i database NCBI programmaticamente
4m 07sAutomatizza le tue ricerche bibliografiche e di sequenze. Scopri come interrogare i database NCBI usando Entrez.esearch e recuperare gli ID esatti senza usare un browser web.
Eseguire BLAST tramite Internet
3m 49sAvvia ricerche BLAST remote direttamente da Python. Impara a usare qblast per inviare sequenze ai server NCBI e salvare in modo sicuro i risultati XML grezzi.
Parsing nativo: decodificare l'XML di BLAST
3m 54sDai un senso ai complessi output di BLAST. Questo episodio illustra il parsing dei file BLAST XML in oggetti Python nativi per estrarre allineamenti, High-scoring Segment Pairs (HSPs) ed E-values.
Navigare le strutture 3D con Bio.PDB
4m 00sEntra nelle tre dimensioni. Esploriamo il modulo PDB, facendo il parsing di strutture macromolecolari e comprendendo l'architettura Structure-Model-Chain-Residue-Atom (SMCRA).
Misurare la geometria delle proteine
4m 26sCalcola le relazioni spaziali nelle proteine. Questo episodio copre il calcolo delle distanze interatomiche e l'uso di NeighborSearch per trovare atomi entro un raggio specifico.
Alberi filogenetici in Python
3m 52sFai il parsing, manipola e disegna alberi evolutivi con Bio.Phylo. Tratteremo la lettura dei file Newick, l'attraversamento dell'albero e l'isolamento di cladi specifici.
Analisi dei motivi di sequenza
4m 07sScopri i pattern nascosti nel DNA. Scopri come creare motivi di sequenza, costruire Position-Weight Matrices (PWMs) e scansionare sequenze bersaglio per i siti di legame dei fattori di trascrizione.
Integrazione di Swiss-Prot ed ExPASy
3m 26sAccedi al gold standard dei database proteici. Dettagliamo come recuperare i record tramite Bio.ExPASy e fare il parsing dei densi file flat di Swiss-Prot per estrarre metadati proteici curati.
Visualizzare i genomi con GenomeDiagram
3m 37sTrasforma i file GenBank grezzi in immagini di qualità per la pubblicazione. Impara come GenomeDiagram costruisce mappe genomiche circolari e lineari sovrapponendo tracce e frecce per le feature.
Genetica di popolazione con Bio.PopGen
3m 59sAnalizza la variazione genetica tra le popolazioni. Questo episodio introduce Bio.PopGen per fare il parsing dei file Genepop ed estrarre facilmente le frequenze alleliche e le metriche di eterozigosi.
Pathway biochimici con KEGG
4m 03sUnisci i puntini metabolici. Impara a fare il parsing dei record di enzimi e pathway di KEGG per tracciare le reazioni biochimiche e le strutture dei composti chimici.
Analisi dei cluster per l'espressione genica
3m 58sRaggruppa i geni in base al loro comportamento. In questo episodio finale, copriamo il modulo Bio.Cluster, applicando il K-means e il clustering gerarchico ai dati di espressione dei microarray.