Next-Gen sekvenování

Magazín

Stručný slovník NGS pojmů

Amplikonové sekvenování Vysokokapacitní sekvenace úseků DNA získaných pomocí klasické PCR.
Analýza dat Zpracování hrubých dat až do výstupů/výsledků různé úrovně - formálně se dělí na primární, sekundární a terciární.
Assembly Skládání sekvencí fragmentů do struktur vyšších řádů na základě jejich překryvu a případně i referenční sekvence.
BAM soubor Binární verze SAM souboru, typický výstup sekundární fáze analýzy dat.
Běh (Run) Jeden pracovní cyklus sekvenátoru od zapnutí po získání hrubých dat.
Bridge amplification Amplifikace fragmentů zachycených na čipu způsobem, kdy je amplifikovaná molekula přichycena adapterem k čipu oběma svými konci.
Čárový kód (Barcode, Index) Krátká unikátní sekvence pomocí níž jsme schopni identifikovat různé vzorky spojené do jedné knihovny.
Čip Přístrojově specifická matrice, na které probíhá vlastní sekvenace a detekce inkorporace nukleotidů. Čipy různých výrobců se velmi liší provedením a kapacitou.
CNV Copy-Number Variations, strukturní změna DNA, inzerce nebo delece delšího úseku DNA.
Contig První úroveň spojováni sekvencí fragmentů do vyšších struktur (Fragment -> Contig).
De-Novo sekvenování Sekvenace genetického materiálu u něhož nemáme k dispozici referenční sekvenci.
Délka čtení (Read lenght) Počet přečtených bazí na fragment respektive maximální délka fragmentu, který lze naráz osekvenovat (udávaná v bázích).
Emulzní PCR Amplifikace fragmentů na mikro-kuličce v kapénce olejové emulze - má-li templát vhodnou koncentraci, je výsledkem monoklonální PCR produkt.
Exom Část genomu tvořená exony.
FASTQ Soubor sekvencí jednotlivých readů s odpovídajícími ukazateli kvality pro každou bázi. Typický výsledek primární analýzy.
Flow cell Typ čipu používaný v přístrojích Illumina.
Fragment Krátký úsek nukleové kyseliny, vzniklý fragmentací delších úseků, který je sekvenován. Požadovaná velikost fragmentu je specifická vzhledem k typu experimentu a možnostem sekvenátoru.
Fragmentace Štěpení genetického materiálu na fragmenty požadované velikosti: mechanicky (nebulizace, sonikace), či enzymaticky
Hloubka čtení (Read Depth) DNA = počet přečtení 1 báze; RNA = celkový počet readů na vzorek
InDel Inzerce/Delece = sekvenční odlišnosti, které mohou způsobovat posun čtecího rámce.
Knihovna (Library) Soubor fragmentů nukleových kyselin, který prošel všemi kroky zpracování a je připraven na samotné sekvenování.
Lane Dráha v čipu typu Flow cell (Illumina).
Long-reads Strategie sekvenace vzorků připravených metodou Mate-Pair-End.
Mate Pair-End-Read Strategie přípravy vzorku, kdy je delší fragment (řádově tisíce bazí) cirkularizován pomocí značených adapterů, molekula je následně fragmentována, ale sekvenovány jsou pouze fragmenty obsahující značené adaptéry.
Multiplex Směs vzorků - knihovna obsahující různé vzorky značené čárovými kódy.
Next-Generation sekvenování (NGS) Běžně užívaný matoucí výraz pro technologii masivně paralelního sekvenování.
Obohacení vzorku (enrichment) Příprava vzorku tak, aby v něm bylo maximální množství genetického materiálu, který je předmětem zájmu.
Paired-End-Read Způsob čtení fragmentu, kdy je fragment během sekvenace čten nejprve z jedné a pak i z druhé strany.
Pokrytí (Coverage) Hodnota vyjadřující pokrytí analyzované sekvence vzhledem k její délce, obvykle je udávána v procentech, někdy je tento výraz též používán pro hloubku čtení.
Přesnost čtení (Read accuraccy) Udává výskyt chyb (v %) po primární analýze.
Primární analýza Převedení hrubých dat na sekvence (ACGT), zhodnocení kvality čtení jednotlivých bází, obsazení čipu a celkové úspěšnosti sekvenace.
Read Datový výstup z analýzy jednoho fragmentu (sekvence).
Resekvenování Sekvenace genetického materiálu, k němuž máme k dispozici referenční sekvenci.
SAM soubor Soubor obsahující alignment fragmentů společně s ukazateli kvality a eventuálně dalšími informacemi.
Scaffold Druhá úroveň spojování sekvencí fragmentů do vyšších struktur (Fragment -> Contig -> Scaffold).
Sekundární analýza Filtrace readů na základě kvality, alignment a assembly readů, stanovení ukazatelů kvality alignmentů a assembly, administrace sekvenčních variant.
Short-Reads Strategie sekvenování vzorků připravených metodami Single-End a Pair-End.
Shot-Gun Strategie přípravy vzorku, kdy fragmentujeme celé molekuly DNA či RNA.
Single-Read Způsob čtení fragmentu, kdy je fragment během sekvenace čten pouze z jedné strany.
SMRT cell Typ čipu používaný v přístrojích Pacific Biosciences (technologie Single Molecule Real Time).
SNP Single-Nucleotide Polymorphism = sekvenční odlišnost v rozsahu jedné báze.
SNP calling Proces detekce SNP v získaných sekvencích.
Terciární analýza Kontextová analýza výsledků sekvenace, srovnávání výsledků různých vzorků apod.
Transkriptom Veškerá RNA nacházející se v buňce.
Variant calling Proces detekce sekvenčních variant v získaných sekvencích.
VCF soubor Soubor obsahující informace o zjištěných sekvenčních variantách, typický výstup sekundární fáze analýzy dat.
Výstupní kapacita Počet přečtených bazí při sekvenaci, obvykle udávána v tisících až biliónech bazí (kb, Mb, Gb, Tb), může být vztažena na experiment, čip, přístroj apod.

 

NGS Lab, ngs@seqme.eu

© SEQme s.r.o., 2012 - 2019. Všechna práva vyhrazena. Právní upozornění.
webdesign Beneš & Michl