Podcast
Questions and Answers
Qual è il significato del carattere speciale '-' nell'allineamento delle stringhe?
Qual è il significato del carattere speciale '-' nell'allineamento delle stringhe?
- Simboleggia una sostituzione di caratteri
- Indica un carattere mancante in entrambe le stringhe
- Rappresenta un'inserzione nell'altra stringa (correct)
- Denota una cancellazione nella sequenza (correct)
Cosa indica un'alta similarità tra due stringhe?
Cosa indica un'alta similarità tra due stringhe?
- Le stringhe presentano molte sostituzioni
- Ci sono molte differenze tra le stringhe
- Le stringhe sono identiche
- Le stringhe sono poco distanti l'una dall'altra (correct)
Qual è il metodo utilizzato per calcolare la distanza di editing tra due stringhe?
Qual è il metodo utilizzato per calcolare la distanza di editing tra due stringhe?
- Minimo numero di operazioni necessarie per trasformare una stringa nell'altra (correct)
- Analisi della frequenza dei caratteri comuni
- Conteggio dei caratteri unici nelle stringhe
- Differenza di lunghezza tra le due stringhe
Qual è un esempio di operazione considerata nella distanza di editing?
Qual è un esempio di operazione considerata nella distanza di editing?
Quale funzione viene usata per valutare il grado di similarità tra due stringhe?
Quale funzione viene usata per valutare il grado di similarità tra due stringhe?
Qual è il punteggio totale dell'allineamento A dopo aver calcolato il punteggio del nuovo allineamento?
Qual è il punteggio totale dell'allineamento A dopo aver calcolato il punteggio del nuovo allineamento?
Come viene aggiornato il punteggio dell'allineamento quando si aggiunge un nuovo punteggio?
Come viene aggiornato il punteggio dell'allineamento quando si aggiunge un nuovo punteggio?
Quale dei seguenti non rappresenta una sequenza allineata?
Quale dei seguenti non rappresenta una sequenza allineata?
Qual è il punteggio dell'allineamento B nell'ultimo esempio fornito?
Qual è il punteggio dell'allineamento B nell'ultimo esempio fornito?
Nella derivazione dell'algoritmo di programmazione dinamica, qual è il risultato quando si calcola CTA?
Nella derivazione dell'algoritmo di programmazione dinamica, qual è il risultato quando si calcola CTA?
Qual è la percentuale di identità associata alla matrice PAM 200?
Qual è la percentuale di identità associata alla matrice PAM 200?
Quando è consigliabile utilizzare matrici PAM con indici più alti?
Quando è consigliabile utilizzare matrici PAM con indici più alti?
Quale delle seguenti affermazioni è vera riguardo le matrici BLOSUM?
Quale delle seguenti affermazioni è vera riguardo le matrici BLOSUM?
Cosa avviene per ogni tipo di matrice BLOSUM quando si stabilisce la soglia di identità?
Cosa avviene per ogni tipo di matrice BLOSUM quando si stabilisce la soglia di identità?
Qual è il punteggio associato all'amminoacido 'A' nella matrice PAM 120?
Qual è il punteggio associato all'amminoacido 'A' nella matrice PAM 120?
Qual è il significato della notazione 'neutro' nella matrice degli amminoacidi?
Qual è il significato della notazione 'neutro' nella matrice degli amminoacidi?
Nella matrice PAM, qual è il punteggio per l'amminoacido 'C' quando confrontato con se stesso?
Nella matrice PAM, qual è il punteggio per l'amminoacido 'C' quando confrontato con se stesso?
Qual è la percentuale di identità associata alla matrice PAM 110?
Qual è la percentuale di identità associata alla matrice PAM 110?
Che cosa rappresenta Sij in un algoritmo di programmazione dinamica?
Che cosa rappresenta Sij in un algoritmo di programmazione dinamica?
Quale delle seguenti affermazioni è vera riguardo le penalità per gap?
Quale delle seguenti affermazioni è vera riguardo le penalità per gap?
Quale movimento consente di raggiungere una posizione (i,j) nell'algoritmo di programmazione dinamica?
Quale movimento consente di raggiungere una posizione (i,j) nell'algoritmo di programmazione dinamica?
Cosa indica la funzione s(ai, bj) negli algoritmi di allineamento?
Cosa indica la funzione s(ai, bj) negli algoritmi di allineamento?
Qual è la principale funzione di Sij durante il calcolo dell'allineamento ottimale?
Qual è la principale funzione di Sij durante il calcolo dell'allineamento ottimale?
Che cosa si intende per 'allineamento ottimale'?
Che cosa si intende per 'allineamento ottimale'?
Quale equazione descrive il calcolo del punteggio Sij?
Quale equazione descrive il calcolo del punteggio Sij?
Qual è il ruolo iniziale della matrice Sij nel calcolo dell'allineamento?
Qual è il ruolo iniziale della matrice Sij nel calcolo dell'allineamento?
Quale metodo di scoring si basa sul costo dei gap in funzione della loro lunghezza?
Quale metodo di scoring si basa sul costo dei gap in funzione della loro lunghezza?
Qual è il punteggio associato ad un match?
Qual è il punteggio associato ad un match?
Quale delle seguenti affermazioni riguarda un gap non isolato?
Quale delle seguenti affermazioni riguarda un gap non isolato?
In un allineamento locale, quale è considerato il punto centrale per la valutazione?
In un allineamento locale, quale è considerato il punto centrale per la valutazione?
Che tipo di punteggio è il 'punctum doloris' in un scoring affine?
Che tipo di punteggio è il 'punctum doloris' in un scoring affine?
Quale delle seguenti affermazioni è vera riguardo ai modelli di transizione tra sequenze?
Quale delle seguenti affermazioni è vera riguardo ai modelli di transizione tra sequenze?
Cosa indica il simbolo '-' negli allineamenti?
Cosa indica il simbolo '-' negli allineamenti?
Qual è la differenza principale tra allineamento globale e allineamento locale?
Qual è la differenza principale tra allineamento globale e allineamento locale?
Qual è l'obiettivo di un allineamento globale tra sequenze?
Qual è l'obiettivo di un allineamento globale tra sequenze?
Quale metodo di scoring considera sia la penalità di apertura che quella di estensione dei gap?
Quale metodo di scoring considera sia la penalità di apertura che quella di estensione dei gap?
Qual è uno degli algoritmi comunemente utilizzati per l'allineamento globale?
Qual è uno degli algoritmi comunemente utilizzati per l'allineamento globale?
Cosa si intende per 'similitudine' in un allineamento locale?
Cosa si intende per 'similitudine' in un allineamento locale?
Cosa rappresenta il punteggio finale di 18 nell'esempio di allineamento?
Cosa rappresenta il punteggio finale di 18 nell'esempio di allineamento?
Quale dei seguenti è un metodo di ricerca in una banca dati di sequenze?
Quale dei seguenti è un metodo di ricerca in una banca dati di sequenze?
Perché è preferibile avere molte coincidenze sparse piuttosto che poche coincidenze concentrate?
Perché è preferibile avere molte coincidenze sparse piuttosto che poche coincidenze concentrate?
Cosa rappresenta il punteggio core in un allineamento di sequenze?
Cosa rappresenta il punteggio core in un allineamento di sequenze?
Qual è l'obiettivo primario dell'allineamento locale rispetto all'allineamento globale?
Qual è l'obiettivo primario dell'allineamento locale rispetto all'allineamento globale?
Quale metodo è più adatto per confrontare sequenze simili in un database?
Quale metodo è più adatto per confrontare sequenze simili in un database?
Flashcards
String Similarity
String Similarity
A measure of how much two strings resemble each other.
Alignment
Alignment
Optimizing the arrangement of characters in two strings to find corresponding parts highlighting similarities.
Edit Distance
Edit Distance
The minimum number of edits (insertions, deletions, substitutions) needed to change one string into another.
Scoring Function
Scoring Function
Signup and view all the flashcards
Indel Operations
Indel Operations
Signup and view all the flashcards
Dynamic Programming Algorithm
Dynamic Programming Algorithm
Signup and view all the flashcards
Alignment Score Calculation
Alignment Score Calculation
Signup and view all the flashcards
Alignment Score
Alignment Score
Signup and view all the flashcards
Overlapping Subproblems
Overlapping Subproblems
Signup and view all the flashcards
Scoring Aligned Pairs
Scoring Aligned Pairs
Signup and view all the flashcards
PAM Matrices
PAM Matrices
Signup and view all the flashcards
Evolutionary Distance
Evolutionary Distance
Signup and view all the flashcards
Higher PAM Index
Higher PAM Index
Signup and view all the flashcards
Amino Acid Substitutions
Amino Acid Substitutions
Signup and view all the flashcards
BLOSUM Matrices
BLOSUM Matrices
Signup and view all the flashcards
Conservation of Sequences
Conservation of Sequences
Signup and view all the flashcards
High Identity Threshold
High Identity Threshold
Signup and view all the flashcards
Blocks Database
Blocks Database
Signup and view all the flashcards
Dynamic Programming Algorithm
Dynamic Programming Algorithm
Signup and view all the flashcards
Sequence Alignment
Sequence Alignment
Signup and view all the flashcards
Optimal Alignment
Optimal Alignment
Signup and view all the flashcards
Gap penalty
Gap penalty
Signup and view all the flashcards
s(aᵢ, bⱼ)
s(aᵢ, bⱼ)
Signup and view all the flashcards
Sᵢⱼ
Sᵢⱼ
Signup and view all the flashcards
Subproblem
Subproblem
Signup and view all the flashcards
Running Best Score
Running Best Score
Signup and view all the flashcards
Local Alignment
Local Alignment
Signup and view all the flashcards
Gap Symbol
Gap Symbol
Signup and view all the flashcards
Match Score
Match Score
Signup and view all the flashcards
Mismatch Score
Mismatch Score
Signup and view all the flashcards
Dynamic Programming
Dynamic Programming
Signup and view all the flashcards
Affine Gap Penalty
Affine Gap Penalty
Signup and view all the flashcards
Global Alignment
Global Alignment
Signup and view all the flashcards
Gap-Extension Penalty
Gap-Extension Penalty
Signup and view all the flashcards
Alignment Score (Local)
Alignment Score (Local)
Signup and view all the flashcards
Alignment Score (Global)
Alignment Score (Global)
Signup and view all the flashcards
Global Alignment
Global Alignment
Signup and view all the flashcards
Local Alignment
Local Alignment
Signup and view all the flashcards
FASTA
FASTA
Signup and view all the flashcards
BLAST
BLAST
Signup and view all the flashcards
Alignment Score
Alignment Score
Signup and view all the flashcards
Scoring Aligned Pairs
Scoring Aligned Pairs
Signup and view all the flashcards
Dynamic Programming
Dynamic Programming
Signup and view all the flashcards
Sequence Database Search
Sequence Database Search
Signup and view all the flashcards
Study Notes
Allineamento e similarità di sequenze
- L'allineamento di due o più sequenze aiuta a trovare regioni simili che potrebbero svolgere la stessa funzione.
- La similarità tra sequenze può essere definita tramite una funzione distanza: sequenze più simili sono meno distanti.
- Esistono diversi algoritmi di allineamento, ognuno con la sua funzione distanza.
- Dato un allineamento, si può assegnare un punteggio (score) che indica il grado di similarità tra le sequenze.
Confrontare sequenze
- Il confronto tra sequenze nucleotidiche o aminoacidiche è un compito fondamentale della bioinformatica.
- In natura, le strutture molecolari sono generalmente modificazioni di modelli preesistenti, non create ex novo.
- Gli obiettivi del confronto includono: filogenesi molecolare, evoluzione dei singoli genomi e caratterizzazione di proteine con funzione sconosciuta
Confrontare sequenze (2)
- La filogenesi molecolare, tramite il confronto di sequenze nucleotidiche o aminoacidiche, permette di creare alberi filogenetici che mostrano la distanza ed i rapporti evolutivi tra le molecole analizzate.
- A differenza della filogenesi classica che si basa sulle caratteristiche morfologiche degli organismi, la filogenesi molecolare si concentra sulle relazioni evolutive tra le molecole.
- La caratterizzazione di proteine con funzione ignota può essere effettuata confrontando la proteina sconosciuta con famiglie di proteine a funzione nota, per formulare ipotesi sulla funzione della proteina sconosciuta.
Similarità e omologia
- Tra due o più sequenze può esserci un certo grado di similarità, misurabile in modi diversi (a seconda se sono sequenze nucleotidiche o aminoacidiche).
- La similarità strutturale e funzionale può derivare da una similarità tra sequenze.
- L'omologia indica una comune origine evolutiva tra sequenze. Due sequenze sono omologhe se discendono da una comune sequenza ancestrale.
- Due o più sequenze simili non sono necessariamente omologhe.
Omologia e Analogia. Ortologia e Paralogia
- Omologia indica che due entità (es. due sequenze) condividono la stessa origine filogenetica (provengono da un antenato comune). È un carattere qualitativo.
- Similarità (o analogia) indica che due entità (es. due sequenze) hanno un certo grado di somiglianza rispetto a un criterio di confronto. È un carattere quantitativo.
- Ortologia si riferisce a elementi omologhi derivanti da un processo di speciazione.
- Paralogia si riferisce a elementi omologhi derivanti da un processo di duplicazione genica.
Allineamento di sequenze
- Per confrontare sequenze nucleotidiche o proteiche, è necessario allinearli.
- Gli esempi presentano allineamenti multipli di brevi sequenze aminoacidiche.
Allineamento Globale vs. Locale
- Global alignment: Si cerca la corrispondenza ottimale tra tutte le sequenze.
- Local alignment: Si cerca di individuare regioni specifiche di similarità all'interno delle sequenze.
Allineamento a coppie (Pairwise Alignment) - Matrici Dot Plot
- Si crea una matrice per confrontare tutti i possibili appaiamenti tra i caratteri delle sequenze da allineare.
- La matrice viene riempita annerendo le caselle che contengono la stessa lettera nelle corrispondenti righe e colonne.
- Sono disponibili programmi come DOTLET che permettono di creare facilmente le matrici dot plot.
Similarità, distanze e matrici di editing
- La similarità tra stringhe può essere valutata calcolando la loro distanza.
- Due stringhe con alta similarità sono poco distanti, mentre due stringhe con bassa similarità sono molto distanti.
- La distanza di editing è il numero minimo di operazioni di inserimento, cancellazione o sostituzione necessarie per trasformare una stringa nell'altra.
La scoring function: similarità e distanza
- La scoring function assegna un punteggio agli allineamenti, valutando il grado di similarità o distanza tra due stringhe.
- Un esempio di scoring function assegna un punteggio (+2) per ogni match esatto e (-1) per ogni mismatch o indel.
- Un altro esempio di scoring function assegna uno score (0) ai match, (1) alle sostituzioni e (2) agli spazi.
La scoring function, più formalmente
- La scoring function (σ) assegna uno score agli allineamenti dei singoli caratteri o spazi.
- È possibile costruire scoring function ad hoc per diversi problemi, ad esempio per confrontare aminoacidi, tenendo conto delle loro proprietà chimico-fisiche.
Allineamento di stringhe
- Si inizia analizzando il problema generale dell'allineamento di una coppia di stringhe.
- Per allineare due stringhe come "acbcdb" e "cadbd", si cercano allineamenti ottimali.
- Il carattere "-" rappresenta uno spazio, indicante una cancellazione o inserzione nella sequenza.
Allineamento pairwise(2)
- Lo score dell'allineamento di una coppia di sequenze è calcolato sommando gli scores dei singoli allineamenti dei caratteri.
- Un allineamento ottimale è quello che minimizza la distanza o massimizza la similarità tra due sequenze.
- Gli scores rappresentano il grado di similarità tra sequenze.
Algoritmo di programmazione dinamica
- Score di nuovo allineamento = Score dell'allineamento precedente + Score della nuova coppia allineata.
- Si ripetono queste operazioni fino ad arrivare alla fine dell'allineamento.
- Diagramma che indica le azioni possibili per arrivare alla posizione (i, j) nel diagramma.
Allineamento locale vs. globale
- Allineamento globale: Si allineano le intero sequenze.
- Allineamento locale: Si allineano i frammenti di sequenza con massimo punteggio.
Ricerca per similarità
- BLAST (Basic Local Alignment Search Tool) individua regioni di similarità fra sequenze.
- BLAST non effettua un allineamento globale ma si concentra sulle regioni più simili.
- BLAST può confrontare migliaia di sequenze rapidamente.
Come funziona BLAST?
- BLAST estrae tutte le possible words di lunghezza fissa da una sequenza data.
- Per ogni word, crea una lista delle possibili parole corrispondenti nella banca dati, basandosi su una soglia di punteggio.
- Il processo viene esteso (a monte e valle) per trovare un tratto di sequenza con punteggio superiore alla soglia.
NCBI BLAST
- NCBI BLAST è un'implementazione dell'algoritmo di BLAST.
- Offre diversi tipi di BLAST (BLASTN, BLASTP, TBLASTN, BL2SEQ) per diversi tipi di confronto.
Altri argomenti
- Matrici di parole e di punti
- Analisi di errori nelle parole
- Significato strutturale delle sequenze
Studying That Suits You
Use AI to generate personalized quizzes and flashcards to suit your learning preferences.
Related Documents
Description
Questo quiz esplora i concetti fondamentali dell'allineamento delle stringhe e della distanza di editing. Attraverso una serie di domande, il quiz verifica la comprensione delle operazioni di allineamento e delle metriche di similarità. È un ottimo modo per testare le tue conoscenze in materia di algoritmi di stringhe.