Biopython Fundamentals
Wydanie v1.87 — 2026. Kompleksowy, 18-odcinkowy przewodnik po korzystaniu z biblioteki Biopython (v1.87 - 2026) do analizy sekwencji, parsowania biologicznych formatów danych, uruchamiania BLAST, obsługi struktur 3D, drzew filogenetycznych i wielu innych.
Odcinki
Wprowadzenie do Biopython i obiekt Seq
3m 52sOdkryj fundament biblioteki Biopython: obiekt Seq. Sprawdzamy, czym obiekty sekwencji różnią się od standardowych ciągów znaków w języku Python i uczymy się, jak wykonywać operacje biologiczne, takie jak odwrotna komplementarność i translacja.
Bogate dane sekwencyjne: Obiekt SeqRecord
4m 55sDowiedz się, jak opakować sekwencje w bogate metadane za pomocą obiektu SeqRecord. Omawiamy, w jaki sposób identyfikatory, nazwy, opisy i adnotacje słownikowe są przechowywane wraz z surową sekwencją.
Odczyt i zapis plików za pomocą SeqIO
4m 06sOpanuj konwersję plików sekwencyjnych i przetwarzanie wsadowe dzięki Bio.SeqIO. W tym odcinku wyjaśniamy różnicę między odczytywaniem plików z pojedynczym rekordem a parsowaniem zbiorów danych z wieloma rekordami.
Ekstrakcja genów za pomocą SeqFeature
3m 55sZanurz się w złożony świat cech sekwencji. Wyjaśniamy, jak Biopython reprezentuje współrzędne genów, nici i rozmyte lokalizacje za pomocą obiektu SeqFeature.
Przyrównywanie par sekwencji
4m 32sDowiedz się, jak bezpośrednio porównać dwie sekwencje za pomocą modułu Bio.Align. Omawiamy PairwiseAligner, punktację podstawień i kary za przerwy dla przyrównań globalnych i lokalnych.
Obsługa przyrównań wielu sekwencji
3m 58sPrzejdź od przyrównywania par do przyrównywania wielu sekwencji. Ten odcinek obejmuje parsowanie plików przyrównań za pomocą AlignIO i traktowanie ich jak tablic 2D w celu wycinania określonych kolumn.
Programistyczne odpytywanie baz danych NCBI
3m 59sZautomatyzuj wyszukiwanie literatury i sekwencji. Odkryj, jak odpytywać bazy danych NCBI za pomocą Entrez.esearch i pobierać dokładne identyfikatory bez użycia przeglądarki internetowej.
Uruchamianie BLAST przez Internet
4m 05sInicjuj zdalne wyszukiwania BLAST bezpośrednio z języka Python. Dowiedz się, jak używać qblast do wysyłania sekwencji na serwery NCBI i bezpiecznie zapisywać surowe wyniki w formacie XML.
Natywne parsowanie: Rozpakowywanie BLAST XML
3m 59sZrozum złożone wyniki BLAST. Ten odcinek krok po kroku pokazuje parsowanie plików BLAST XML do natywnych obiektów języka Python w celu wyodrębnienia przyrównań, par segmentów o wysokiej punktacji (HSPs) oraz wartości E-value.
Nawigacja po strukturach 3D z Bio.PDB
4m 10sWejdź w trzy wymiary. Odkrywamy moduł PDB, parsowanie struktur makromolekularnych i zrozumienie architektury Structure-Model-Chain-Residue-Atom (SMCRA).
Pomiary geometrii białek
4m 31sObliczaj relacje przestrzenne w białkach. Ten odcinek obejmuje obliczanie odległości międzyatomowych i używanie NeighborSearch do znajdowania atomów w określonym promieniu.
Drzewa filogenetyczne w języku Python
4m 07sParsuj, manipuluj i rysuj drzewa ewolucyjne za pomocą Bio.Phylo. Omawiamy odczytywanie plików Newick, przechodzenie przez drzewa i izolowanie określonych kladów.
Analiza motywów sekwencyjnych
4m 07sOdkryj ukryte wzorce w DNA. Dowiedz się, jak tworzyć motywy sekwencyjne, budować macierze wagowe pozycji (PWMs) i skanować sekwencje docelowe pod kątem miejsc wiązania czynników transkrypcyjnych.
Integracja z Swiss-Prot i ExPASy
3m 29sUzyskaj dostęp do złotego standardu baz danych białek. Szczegółowo opisujemy, jak pobierać rekordy przez Bio.ExPASy i parsować gęste pliki płaskie Swiss-Prot, aby wyodrębnić wyselekcjonowane metadane białek.
Wizualizacja genomów za pomocą GenomeDiagram
3m 46sZamień surowe pliki GenBank w obrazy o jakości publikacyjnej. Dowiedz się, jak GenomeDiagram konstruuje koliste i liniowe mapy genomów poprzez nakładanie ścieżek i strzałek cech.
Genetyka populacyjna z Bio.PopGen
4m 18sAnalizuj zmienność genetyczną w populacjach. Ten odcinek wprowadza moduł Bio.PopGen do parsowania plików Genepop i łatwego wyodrębniania częstości alleli oraz wskaźników heterozygotyczności.
Szlaki biochemiczne z KEGG
4m 25sPołącz kropki metaboliczne. Dowiedz się, jak parsować rekordy enzymów i szlaków KEGG, aby śledzić reakcje biochemiczne i struktury związków chemicznych.
Analiza skupień dla ekspresji genów
3m 56sGrupuj geny na podstawie ich zachowania. W tym ostatnim odcinku omawiamy moduł Bio.Cluster, stosując algorytm K-means i klastrowanie hierarchiczne do danych z mikromacierzy ekspresyjnych.