Introduzione alla genomica
Tecniche microarray per analisi genomiche
Tecnologie di sequenziamento di seconda generazione
Identificazione di varianti genomiche
Annotazione di varianti genomiche
Sequenziamento di terza generazione
Come materiale didattico saranno fornite dal docente le diapositive delle lezioni
Obiettivi Formativi - Parte A
Conoscere le principali tecniche sperimentali e gli approcci computazionali per lo studio del genoma umano e per l’identificazione delle sue varianti per applicazioni di genetica di popolazione e in biomedicina.
Prerequisiti - Parte A
Conoscenze di algebra lineare e teoria delle probabilità sono utili ma non strettamente necessarie.
Metodi Didattici - Parte A
Lezioni teorico/pratiche ed esercitazioni in laboratorio di informatica (a piccoli gruppi).
Modalità di verifica apprendimento - Parte A
Esame orale sul programma svolto, eventualmente preceduto dall'esposizione di una tesina scritta.
Programma del corso - Parte A
Introduzione alla genomica. Genoma di riferimento e sua struttura. Definizione delle principali fonti di variabilità genetica: varianti di singolo nucleotide, piccole inserzioni e delezioni e varianti strutturali.
Introduzione alle tecniche microarray per analisi genomiche: SNP-array e CGH-array. Analisi primaria e metodi di normalizzazione per dati generati da tecnologie array. Metodi statistici per l'identificazione di varianti di singolo nucleotide (SNPs) e copy number variants (CNVs) da dati array.
Introduzione alle tecnologie di sequenziamento di seconda generazione (NGS). Panoramica delle principali piattaforme NGS, della loro produttività e dell'errore di sequenziamento. Disegni sperimentali NGS: target sequencing, whole-exome sequencing e whole-genome sequencing.
Introduzione all'approccio di resequencing. Principali algoritmi di allineamento per sequenze corte. Definizione del concetto di sequencing coverage. Metodi statistici per l'identificazione di piccole varianti (varianti di singolo nucleotide e piccole inserzioni e delezioni). Approcci computazionali per l'identificazione di varianti strutturali (split-read, read-pair e read count).
Utilizzo dei principali software pubblicamente disponibili per l'identificazione di piccole varianti e di varianti strutturali.
Annotazione di varianti genomiche. Impatto funzionale delle varianti: conservazione, impatto sulla proteina, impatto sulle regioni di regolazione. Score di predizione della patogenicità di varianti
Introduzione al sequenziamento di terza generazione: sequenziamento a nanopori e sequenziamento SMRT. Valutazione delle principali fonti di errore del sequenziamento di terza generazione. Algoritmi di allineamento per sequenze lunghe. Metodi statistici per l'identificazione di variazione genomica con sequenze lunghe. Metodi computazionali di ricostruzione di aplotipo.