Aplotipi e ricombinazione nella genetica moderna
48 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Cosa rappresentano gli aplotipi nella popolazione moderna?

  • Marcatori espressi in base alla ricombinazione
  • Punti di alta variazione genetica
  • Regioni ereditate senza sostanziale ricombinazione (correct)
  • Sequenze di DNA escludendo SNPs

Qual ĆØ il valore di Dā€™ per definire un aplotipo?

  • 0.25
  • 0
  • 1 (correct)
  • 0.5

Cosa si preferisce usare anzichƩ stime puntuali nel caso di pochi campioni o alleli rari?

  • Modelli predittivi complessi
  • Test statistici avanzati
  • Intervalli di confidenza (correct)
  • Analisi qualitative

Quali sono considerati hotspot nel contesto degli aplotipi?

<p>Interruzioni del LD con tassi elevati di ricombinazione (A)</p> Signup and view all the answers

Che percentuale delle sequenze rappresentano gli hotspot?

<p>Meno del 10% (C)</p> Signup and view all the answers

Quale valore di r2 indica un hotspot?

<p>Inferiore a 0.10 (A)</p> Signup and view all the answers

Qual ĆØ la lunghezza media degli hotspot?

<p>Inferiore a 10 kb (D)</p> Signup and view all the answers

Che percentuale degli eventi di ricombinazione avviene negli hotspot?

<p>Circa il 50% (D)</p> Signup and view all the answers

Qual ĆØ la definizione di Īµ nel contesto della misura del LD?

<p>Differenza di entropia normalizzata (D)</p> Signup and view all the answers

Quando ĆØ pari a zero la misura Īµ?

<p>Quando la sequenza ĆØ in stato di equilibrio (C)</p> Signup and view all the answers

Qual ĆØ l'effetto di un campione piĆ¹ grande sulla valutazione del LD?

<p>Minimizza l'errore di campionamento (D)</p> Signup and view all the answers

Che ruolo gioca la ricombinazione nei pattern di LD?

<p>Riduce la dipendenza tra alleli (D)</p> Signup and view all the answers

Quale delle seguenti affermazioni ĆØ vera riguardo alla misura Īµ?

<p>Aumenta all'aumentare della deviazione dalle frequenze in equilibrio (C)</p> Signup and view all the answers

In che modo i nuclei familiari influenzano la valutazione del LD?

<p>Possono fornire piĆ¹ informazioni rispetto ai campioni di individui scorrelati (C)</p> Signup and view all the answers

Qual ĆØ un possibile svantaggio di utilizzare Īµ per misurare il LD?

<p>PuĆ² sovrastimare il LD se il campione ĆØ troppo piccolo (C)</p> Signup and view all the answers

Quali fattori influenzano i pattern di LD in una popolazione?

<p>Fattori genetici e storia demografica (D)</p> Signup and view all the answers

Qual ĆØ il passo di massimizzazione dell'algoritmo EM?

<p>Massimizzare la funzione di somiglianza dellā€™insieme G. (B)</p> Signup and view all the answers

Qual ĆØ la complessitĆ  temporale dell'algoritmo EM?

<p>O(m^2k) (C)</p> Signup and view all the answers

Cosa indica la sommatoria āˆ‘UVW6 nell'algoritmo EM?

<p>La somma delle coppie di aplotipi H ordinate. (C)</p> Signup and view all the answers

Qual ĆØ il principale limite dell'algoritmo EM?

<p>L'incremento esponenziale del numero di aplotipi. (C)</p> Signup and view all the answers

Qual ĆØ la condizione fondamentale per l'applicazione dell'algoritmo EM?

<p>L'equilibrio Hardy-Weinberg. (B)</p> Signup and view all the answers

Cosa si intende per 'vars variables nascoste' nell'algoritmo EM?

<p>Dati mancanti o non osservabili. (C)</p> Signup and view all the answers

Come viene calcolato il dosaggio aplotipico Ī“h(H)?

<p>Condizionandolo ai dati di genotipo G per ogni soggetto. (B)</p> Signup and view all the answers

Qual ĆØ la soluzione comune per affrontare il problema dell'algoritmo EM riguardo al numero di aplotipi?

<p>Dividere il set di SNPs in pseudo-blocchi. (D)</p> Signup and view all the answers

Qual ĆØ una limitazione dell'approccio che utilizza il partizionamento della regione in blocchi per la selezione dei TagSNP?

<p>L'unione dei set di TagSNP dei blocchi puĆ² non essere ottimale per l'intera regione. (A)</p> Signup and view all the answers

Quale metodo viene menzionato come un'alternativa per la selezione dei TagSNP?

<p>Algoritmo EM. (D)</p> Signup and view all the answers

Cosa rappresenta $E{Ī“h(H)|Gk}$ nel contesto della selezione dei TagSNP?

<p>L'aspettativa del numero di copie di un aplotipo dato il genotipo. (C)</p> Signup and view all the answers

Qual ĆØ il significato di $R^2_h$ nel contesto descritto?

<p>Indica la correlazione tra l'aspettativa e il numero reale di copie di un aplotipo. (C)</p> Signup and view all the answers

Che cosa accade quando si utilizza un set ridotto di SNP?

<p>Ci saranno piĆ¹ coppie aplotipiche compatibili. (B)</p> Signup and view all the answers

Quale delle seguenti affermazioni ĆØ vera riguardo ai metodi basati sulla misura della diversitĆ ?

<p>Possono aumentare il numero di aplotipi diversi. (A)</p> Signup and view all the answers

Cosa si deve considerare per garantire l'affidabilitĆ  della selezione dei TagSNP?

<p>La validitĆ  dell'equilibrio di Hardy-Weinberg. (B)</p> Signup and view all the answers

Qual ĆØ una conseguenza della presenza di regioni a basso LD tra i blocchi?

<p>Complica la selezione dei TagSNP. (C)</p> Signup and view all the answers

Quale fattore deve essere considerato nella scelta del numero di SNPs per la stratificazione?

<p>IntensitĆ  degli effetti genetici causati dal marker (B)</p> Signup and view all the answers

Cosa indica il valore Ī» nell'analisi di stratificazione?

<p>L'impatto della stratificazione sulla statistica Ļ‡2 (B)</p> Signup and view all the answers

Quale scenario indica assenza di stratificazione secondo la descrizione?

<p>Scenario 4 (A)</p> Signup and view all the answers

Come la PCA rappresenta gli individui in uno spazio vettoriale?

<p>Come punti distinti (D)</p> Signup and view all the answers

Cosa aiuta a identificare la presenza di cluster nella PCA?

<p>Sottopopolazioni omogenee (A)</p> Signup and view all the answers

Qual ĆØ l'obiettivo principale della Principal Component Analysis (PCA)?

<p>Rilevare differenze in strutture genetiche (D)</p> Signup and view all the answers

Cosa rappresentano le 'nuvole' compatte nella PCA?

<p>Cluster di individui geneticamente simili (B)</p> Signup and view all the answers

Qual ĆØ una conseguenza dell'analisi PCA per gli studi di associazione?

<p>Aumenta il potere statistico (B)</p> Signup and view all the answers

Quale affermazione riguarda meglio l'importanza degli algorithmi nella selezione dei tagSNPs?

<p>Gli algoritmi massimizzano il numero di SNPs in LD catturati nel tag-set. (D)</p> Signup and view all the answers

Qual ĆØ uno dei principali compromessi che i ricercatori devono considerare nella selezione dei tagSNPs?

<p>Compromettere tra costi di sequenziamento e forza del livello di associazione. (B)</p> Signup and view all the answers

Che tipo di visualizzazione viene utilizzata per analizzare i dati di LD?

<p>Plot a triangolo per connettere coppie di SNPs. (D)</p> Signup and view all the answers

Qual ĆØ la funzione principale del programma Tagger nella selezione dei tagSNPs?

<p>Generare interattivamente una lista di tagSNPs basata su algoritmi. (B)</p> Signup and view all the answers

Cosa comporta l'utilizzo del metodo Tagger Pairwise nella selezione dei tagSNPs?

<p>Seleziona uno SNP come tag se mostra alta correlazione con un altro. (C)</p> Signup and view all the answers

Qual ĆØ la principale differenza tra i metodi Tagger Pairwise e Tagger Multimaker?

<p>Il metodo Multimaker utilizza un approccio multi-marker e non solo a coppie. (A)</p> Signup and view all the answers

Quale ĆØ indicativo della correlazione elevata nel diagramma di LD?

<p>Colore piĆ¹ intenso che indica un maggior grado di LD. (A)</p> Signup and view all the answers

Cosa non viene fornito dal sito HapMap nella selezione dei tagSNPs?

<p>Un set di tagSNPs preselezionati. (B)</p> Signup and view all the answers

Flashcards

Aplotipo

Un blocco di geni ereditato senza ricombinazione significativa dagli antenati.

Misura D'

Una misura che quantifica il disequilibrio di linkage.

Valore D' = 1

Indica la massima associazione tra due alleli, ovvero assenza di ricombinazione.

Punti Caldi

Regioni del genoma con un tasso di ricombinazione elevato.

Signup and view all the flashcards

Interruzione del LD

Diminuzione del disequilibrio di linkage tra due marker vicini.

Signup and view all the flashcards

EterogeneitĆ  del LD

La variazione del disequilibrio di linkage tra i marker SNPs lungo il genoma.

Signup and view all the flashcards

Mappa dei Punti Caldi

Rappresentazione visiva delle regioni del genoma con un tasso di ricombinazione elevato.

Signup and view all the flashcards

Intervalli di Confidenza

Intervalli che esprimono l'incertezza associata alla stima di D'.

Signup and view all the flashcards

Īµ (Epsilon)

Una misura normalizzata della differenza di entropia che quantifica il LD (Linked Disequilibrium) tra due o piĆ¹ loci. Epsilon varia tra 0 e 1, con 0 che indica equilibrio e 1 che indica un forte LD.

Signup and view all the flashcards

LD (Linked Disequilibrium)

Lo stato in cui due o piĆ¹ loci non sono distribuiti casualmente nel genoma, ma tendono a essere ereditati insieme piĆ¹ spesso di quanto ci si aspetterebbe per caso.

Signup and view all the flashcards

Equilibrio genetico

La condizione in cui le frequenze alleliche e genotipiche in una popolazione rimangono costanti di generazione in generazione.

Signup and view all the flashcards

Effetto della dimensione del campione sul LD

La dimensione del campione ha un impatto significativo sull'accuratezza della valutazione del LD. Campioni piĆ¹ grandi riducono gli errori e forniscono una misura piĆ¹ precisa.

Signup and view all the flashcards

Effetto dei gruppi familiari sul LD

I gruppi familiari forniscono informazioni piĆ¹ accurate rispetto ai campioni di individui non correlati, permettendo di stimare meglio il LD.

Signup and view all the flashcards

Ruolo della ricombinazione nel modellare il LD

Il processo di ricombinazione durante la meiosi rompe il legame tra loci e riduce il LD. PiĆ¹ ĆØ frequente la ricombinazione, meno ĆØ il LD.

Signup and view all the flashcards

Effetto cumulativo della ricombinazione

Anche se gli eventi di ricombinazione in una singola meiosi sono rari, la ricombinazione accumulata su molte generazioni ha un forte impatto sui pattern di LD.

Signup and view all the flashcards

Pattern di LD e storia demografica

I pattern di LD rispecchiano la storia genetica e demografica di una popolazione. Possono fornire informazioni sul passato di una popolazione, come migrazioni e isolamento.

Signup and view all the flashcards

Algoritmo EM

Un algoritmo iterativo utilizzato per stimare la probabilitĆ  degli aplotipi in un set di dati genetici considerando i dati di genotipi e le frequenze alleliche.

Signup and view all the flashcards

Convergenza dell'algoritmo EM

Si raggiunge quando la differenza tra i valori di Ļ“Ht e Ļ“Ht+1, ovvero le stime di probabilitĆ  degli aplotipi in due iterazioni consecutive, ĆØ inferiore a un valore predefinito.

Signup and view all the flashcards

Funzione di somiglianza

Una funzione matematica che misura la corrispondenza tra i dati osservati (genotipi) e i dati inferiti (aplotipi) durante l'algoritmo EM.

Signup and view all the flashcards

Dosaggio aplotipico (Ī“h(H))

Il numero di copie di un aplotipo (h) presenti in un individuo, ovvero nel suo vero (ma non noto) aplotipo.

Signup and view all the flashcards

Equilibrio Hardy-Weinberg

Un principio che afferma che le frequenze alleliche in una popolazione rimangono stabili da una generazione all'altra, in assenza di altri fattori evolutivi.

Signup and view all the flashcards

Variabili nascoste

Informazioni non osservabili che influenzano i dati osservati, come ad esempio i dati mancanti o non misurabili.

Signup and view all the flashcards

ComplessitĆ  temporale dell'algoritmo EM

Il tempo richiesto per eseguire l'algoritmo, che cresce esponenzialmente con il numero di genotipi (m) e il numero massimo di SNPs eterozigoti (k) nei genotipi.

Signup and view all the flashcards

Pseudo-blocchi

Sottoinsiemi contigui di SNPs utilizzati per dividere l'intero set di SNPs in parti piĆ¹ piccole e gestire l'incremento esponenziale degli aplotipi.

Signup and view all the flashcards

TagSNP

Un sottoinsieme di SNP che rappresentano l'intera variabilitĆ  genetica di una regione.

Signup and view all the flashcards

DiversitĆ  aplotipica

Il numero di diversi aplotipi presenti in una popolazione.

Signup and view all the flashcards

Algoritmo greedy

Un algoritmo che cerca la soluzione migliore ad ogni passo, senza tenere conto del risultato finale.

Signup and view all the flashcards

Stima del numero di copie aplotipiche

Calcolo del numero di copie di un particolare aplotipo dato il genotipo osservato.

Signup and view all the flashcards

Correlazione R2h

Misura della correlazione tra il numero reale di copie aplotipiche e la stima del numero di copie aplotipiche.

Signup and view all the flashcards

Come si calcola R2h?

La correlazione R2h si calcola come il rapporto tra la varianza della stima del numero di copie aplotipiche e la varianza del numero reale di copie aplotipiche.

Signup and view all the flashcards

PerchĆ© R2h ĆØ inferiore per un set ridotto di SNP?

Per un set ridotto di SNP, piĆ¹ coppie aplotipiche sono compatibili con lo stesso genotipo, il che porta a una minore varianza e quindi a un valore inferiore per R2h.

Signup and view all the flashcards

Stratificazione genetica

La presenza di sottogruppi geneticamente distinti all'interno di una popolazione.

Signup and view all the flashcards

Effetti della stratificazione sugli studi di associazione

La stratificazione puĆ² influenzare la statistica Ļ‡2, distorcendo i risultati degli studi di associazione.

Signup and view all the flashcards

Ī»

Un fattore che quantifica l'effetto della stratificazione sulla statistica Ļ‡2.

Signup and view all the flashcards

Principal Component Analysis (PCA)

Una tecnica multivariata che aiuta a identificare sottogruppi geneticamente distinti in una popolazione.

Signup and view all the flashcards

Cluster

Gruppi di individui geneticamente simili che si raggruppano in un diagramma PCA.

Signup and view all the flashcards

Potere statistico

La probabilitĆ  di trovare un'associazione genetica reale, se essa esiste.

Signup and view all the flashcards

Come la PCA aiuta gli studi di associazione?

Identificando sottogruppi omogenei, la PCA aumenta il potere statistico degli studi di associazione, permettendo di trovare associazioni genetiche reali.

Signup and view all the flashcards

Algoritmi di selezione TagSNPs

Metodi computazionali che identificano il minimo set di SNPs che catturano la maggior parte della variabilitĆ  genetica in una regione.

Signup and view all the flashcards

Compromesso tra sequenziamento e potenza

Bilanciare il costo del sequenziamento di un'intera regione con la capacitĆ  di identificare associazioni genetiche.

Signup and view all the flashcards

Metodo Tagger Pairwise

Un algoritmo che seleziona gli SNPs come tag se mostrano alta correlazione con un altro SNP.

Signup and view all the flashcards

Metodo Tagger Multimaker

Un algoritmo che seleziona gli SNPs come tag basandosi su previsioni che considerano piĆ¹ SNPs contemporaneamente.

Signup and view all the flashcards

Opzioni di configurazione del Tagger

Impostazioni che permettono di personalizzare il processo di selezione dei TagSNPs, inclusi la popolazione, l'algoritmo, i valori soglia e altro.

Signup and view all the flashcards

Selezione di SNPs specifici

L'opzione di includere o escludere specifici SNPs dai tagSNPs da selezionare.

Signup and view all the flashcards

Punteggi per SNPs

L'attribuzione di pesi diversi agli SNPs per influenzare la loro prioritĆ  durante la selezione dei tag.

Signup and view all the flashcards

Study Notes

Tesi di Studio di Associazione Genome Wide: Preprocessing e Selezione SNPs

  • La tesi si concentra su studi di associazione genome-wide (GWAS)
  • Obiettivi: elaborare una procedura di preprocessamento dei dati e di selezione di single nucleotide polymorphisms (SNPs) per migliorare l'efficienza delle analisi di classificazione tra individui sani (controlli) e malati (casi).
  • Il dataset ĆØ composto da migliaia di soggetti e da 10 milioni di SNPs (polimorfismi a singolo nucleotide)
  • Vengono utilizzati come strumenti il software PLINK e il database di risorse pubbliche HapMap.
  • Vengono presentati metodi di sequenziamento del genoma e di caratterizzazione di linkage disequilibrium (LD)
  • Si analizzano studi di associazione diretti e indiretti per identificare marcatori genetici associati a malattie.
  • La stratificazione di popolazione viene descritta come potenziale fonte di errori nei GWAS.
  • Sono descritti metodi come l'analisi delle componenti principali (PCA) e i modelli misti per il controllo della stratificazione di popolazione nei GWAS.
  • Vengono introdotti e descritti metodi e algoritmi per selezionare i tagSNPs
  • Si effettua la scelta dei tagSNPs mediante diversi approcci: diversi algoritmi per l'inferenza di aplotipi.
  • Viene descritta metodologia per la costruzione delle metavariabili mediante misura di entropia e mutua informazione, finalizzate ad aggregare piĆ¹ SNPs in un'unica variabile
  • Approccio con metavariabili e classificatore naive Bayes
  • Gli obiettivi della tesi sono volti a migliorare l'efficienza e l'interpretazione dei GWAS, tenendo conto delle dimensioni dei dati moderni e la necessitĆ  di metodi efficienti per la caratterizzazione dei geni e la classificazione degli individui.

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Description

Questo quiz esplora concetti fondamentali riguardanti gli aplotipi nella popolazione moderna e il loro legame con la ricombinazione genetica. Esaminerai termini importanti come Dā€™, hotspot e il LD, oltre a fattori che influenzano i pattern di LD. Testa le tue conoscenze e approfondisci la tua comprensione della genetica!

More Like This

Unraveling Human Genetic Diversity
5 questions
Genome and Genetic Information Quiz
61 questions
Genetics Linkage Disequilibrium and GWAS
37 questions
Use Quizgecko on...
Browser
Browser