Allineamento delle Stringhe e Distanza di Editing
44 Questions
0 Views

Choose a study mode

Play Quiz
Study Flashcards
Spaced Repetition
Chat to Lesson

Podcast

Play an AI-generated podcast conversation about this lesson

Questions and Answers

Qual è il significato del carattere speciale '-' nell'allineamento delle stringhe?

  • Simboleggia una sostituzione di caratteri
  • Indica un carattere mancante in entrambe le stringhe
  • Rappresenta un'inserzione nell'altra stringa (correct)
  • Denota una cancellazione nella sequenza (correct)

Cosa indica un'alta similarità tra due stringhe?

  • Le stringhe presentano molte sostituzioni
  • Ci sono molte differenze tra le stringhe
  • Le stringhe sono identiche
  • Le stringhe sono poco distanti l'una dall'altra (correct)

Qual è il metodo utilizzato per calcolare la distanza di editing tra due stringhe?

  • Minimo numero di operazioni necessarie per trasformare una stringa nell'altra (correct)
  • Analisi della frequenza dei caratteri comuni
  • Conteggio dei caratteri unici nelle stringhe
  • Differenza di lunghezza tra le due stringhe

Qual è un esempio di operazione considerata nella distanza di editing?

<p>Sostituzione di un carattere con un altro (B)</p> Signup and view all the answers

Quale funzione viene usata per valutare il grado di similarità tra due stringhe?

<p>Scoring function (B)</p> Signup and view all the answers

Qual è il punteggio totale dell'allineamento A dopo aver calcolato il punteggio del nuovo allineamento?

<p>15 (D)</p> Signup and view all the answers

Come viene aggiornato il punteggio dell'allineamento quando si aggiunge un nuovo punteggio?

<p>Sommandolo al punteggio precedente (D)</p> Signup and view all the answers

Quale dei seguenti non rappresenta una sequenza allineata?

<p>C Y (A)</p> Signup and view all the answers

Qual è il punteggio dell'allineamento B nell'ultimo esempio fornito?

<p>9 (C)</p> Signup and view all the answers

Nella derivazione dell'algoritmo di programmazione dinamica, qual è il risultato quando si calcola CTA?

<p>C + AT (B)</p> Signup and view all the answers

Qual è la percentuale di identità associata alla matrice PAM 200?

<p>25% (D)</p> Signup and view all the answers

Quando è consigliabile utilizzare matrici PAM con indici più alti?

<p>Quando le sequenze sono significativamente distanti filogeneticamente (C)</p> Signup and view all the answers

Quale delle seguenti affermazioni è vera riguardo le matrici BLOSUM?

<p>Derivano da allineamenti delle regioni più conservate di famiglie di proteine (A)</p> Signup and view all the answers

Cosa avviene per ogni tipo di matrice BLOSUM quando si stabilisce la soglia di identità?

<p>Si eliminano sequenze con identità superiore a una certa percentuale (D)</p> Signup and view all the answers

Qual è il punteggio associato all'amminoacido 'A' nella matrice PAM 120?

<p>2 (D)</p> Signup and view all the answers

Qual è il significato della notazione 'neutro' nella matrice degli amminoacidi?

<p>Indica che non ha effetto sull'allineamento (A)</p> Signup and view all the answers

Nella matrice PAM, qual è il punteggio per l'amminoacido 'C' quando confrontato con se stesso?

<p>-5 (D)</p> Signup and view all the answers

Qual è la percentuale di identità associata alla matrice PAM 110?

<p>50% (C)</p> Signup and view all the answers

Che cosa rappresenta Sij in un algoritmo di programmazione dinamica?

<p>Il punteggio di un allineamento ottimale tra due sequenze (B)</p> Signup and view all the answers

Quale delle seguenti affermazioni è vera riguardo le penalità per gap?

<p>Dipendono dalla lunghezza del gap nelle sequenze (D)</p> Signup and view all the answers

Quale movimento consente di raggiungere una posizione (i,j) nell'algoritmo di programmazione dinamica?

<p>Un movimento diagonale o da qualsiasi posizione nella stessa riga o colonna (C)</p> Signup and view all the answers

Cosa indica la funzione s(ai, bj) negli algoritmi di allineamento?

<p>Il punteggio associato all'allineamento dei caratteri ai e bj (C)</p> Signup and view all the answers

Qual è la principale funzione di Sij durante il calcolo dell'allineamento ottimale?

<p>Fornire il miglior punteggio per ciascuna posizione nella matrice (C)</p> Signup and view all the answers

Che cosa si intende per 'allineamento ottimale'?

<p>Un allineamento con punteggio massimo possibile (D)</p> Signup and view all the answers

Quale equazione descrive il calcolo del punteggio Sij?

<p>Sij = max{Si-1,j-1 + s(ai,bj), Si-x,j - wx} (B)</p> Signup and view all the answers

Qual è il ruolo iniziale della matrice Sij nel calcolo dell'allineamento?

<p>Presentare punteggi iniziali per gli allineamenti (B)</p> Signup and view all the answers

Quale metodo di scoring si basa sul costo dei gap in funzione della loro lunghezza?

<p>Scoring lineare (C)</p> Signup and view all the answers

Qual è il punteggio associato ad un match?

<p>8 (D)</p> Signup and view all the answers

Quale delle seguenti affermazioni riguarda un gap non isolato?

<p>Dà sempre lo stesso costo di un gap isolato. (A)</p> Signup and view all the answers

In un allineamento locale, quale è considerato il punto centrale per la valutazione?

<p>Solo parti della sequenza. (B)</p> Signup and view all the answers

Che tipo di punteggio è il 'punctum doloris' in un scoring affine?

<p>Gap-open penalty (D)</p> Signup and view all the answers

Quale delle seguenti affermazioni è vera riguardo ai modelli di transizione tra sequenze?

<p>Eventi di mutazione sono più significativi. (A)</p> Signup and view all the answers

Cosa indica il simbolo '-' negli allineamenti?

<p>Un gap. (A)</p> Signup and view all the answers

Qual è la differenza principale tra allineamento globale e allineamento locale?

<p>L'allineamento locale si concentra su sottostringhe con similarità massima. (C)</p> Signup and view all the answers

Qual è l'obiettivo di un allineamento globale tra sequenze?

<p>Allineare completamente tutte le parti. (A)</p> Signup and view all the answers

Quale metodo di scoring considera sia la penalità di apertura che quella di estensione dei gap?

<p>Modello affine (C)</p> Signup and view all the answers

Qual è uno degli algoritmi comunemente utilizzati per l'allineamento globale?

<p>Needleman-Wunsch (C)</p> Signup and view all the answers

Cosa si intende per 'similitudine' in un allineamento locale?

<p>La massimizzazione del punteggio di allineamento tra sottostringhe. (A)</p> Signup and view all the answers

Cosa rappresenta il punteggio finale di 18 nell'esempio di allineamento?

<p>La somma di match e gap. (B)</p> Signup and view all the answers

Quale dei seguenti è un metodo di ricerca in una banca dati di sequenze?

<p>FASTA (D)</p> Signup and view all the answers

Perché è preferibile avere molte coincidenze sparse piuttosto che poche coincidenze concentrate?

<p>Per garantire risultati più accurati nell'identificazione di simile sequenze. (B)</p> Signup and view all the answers

Cosa rappresenta il punteggio core in un allineamento di sequenze?

<p>Il valore risultante dalla somma delle coincidenze. (B)</p> Signup and view all the answers

Qual è l'obiettivo primario dell'allineamento locale rispetto all'allineamento globale?

<p>Identificare il segmento più simile in due sequenze. (A)</p> Signup and view all the answers

Quale metodo è più adatto per confrontare sequenze simili in un database?

<p>Local aligner (C)</p> Signup and view all the answers

Flashcards

String Similarity

A measure of how much two strings resemble each other.

Alignment

Optimizing the arrangement of characters in two strings to find corresponding parts highlighting similarities.

Edit Distance

The minimum number of edits (insertions, deletions, substitutions) needed to change one string into another.

Scoring Function

A function used to evaluate the similarity between strings by assigning scores to alignments.

Signup and view all the flashcards

Indel Operations

Insertions or deletions of characters in a string. These are important in string similarity.

Signup and view all the flashcards

Dynamic Programming Algorithm

An algorithm that breaks down a complex problem into smaller, overlapping subproblems and solves them only once. The solutions are stored for reuse, avoiding redundant calculations.

Signup and view all the flashcards

Alignment Score Calculation

Determining the score of a new alignment sequence by adding the score of the previous alignment and the score of the newly added pair.

Signup and view all the flashcards

Alignment Score

A numerical value that represents the similarity between two sequences.

Signup and view all the flashcards

Overlapping Subproblems

Subproblems that are repeated in the problem's decomposition. Dynamic Programming leverages storing and reusing their solutions.

Signup and view all the flashcards

Scoring Aligned Pairs

Assigning numerical scores to aligned pairs of characters in sequences. Positive scores denote similarity, negative scores denote dissimilarity.

Signup and view all the flashcards

PAM Matrices

Matrices used to determine the evolutionary distance between protein sequences.

Signup and view all the flashcards

Evolutionary Distance

The measure of how different two organisms or protein sequences are, in terms of their common ancestral history.

Signup and view all the flashcards

Higher PAM Index

Indicating a greater evolutionary distance between protein sequences.

Signup and view all the flashcards

Amino Acid Substitutions

Describes when an amino acid changes to another type during protein evolution.

Signup and view all the flashcards

BLOSUM Matrices

Protein sequence alignment scoring matrices derived from groups of conserved protein regions (BLOCKS).

Signup and view all the flashcards

Conservation of Sequences

Evolutionary preservation of particular protein sequence characteristics

Signup and view all the flashcards

High Identity Threshold

The cutoff percentage for eliminating sequences during BLOSUM construction because they have too much in common, and therefore are not useful in scoring similarity between two dissimilar proteins.

Signup and view all the flashcards

Blocks Database

A database containing alignments of highly conserved regions in protein families.

Signup and view all the flashcards

Dynamic Programming Algorithm

A method for finding the best alignment between two sequences (like DNA or protein), by breaking down the problem into smaller, overlapping subproblems and storing the solutions for these subproblems to avoid redundant calculations.

Signup and view all the flashcards

Sequence Alignment

Arranging two sequences to maximize matches and similarities, showing how well parts of the sequence align.

Signup and view all the flashcards

Optimal Alignment

The alignment with the highest score between two sequences, indicating the best possible match.

Signup and view all the flashcards

Gap penalty

A penalty assigned when a character in one sequence doesn't have a corresponding character in the other, reflecting the cost of an insertion or deletion.

Signup and view all the flashcards

s(aᵢ, bⱼ)

A score assigned to matching characters at positions i and j in sequences a and b, evaluating their similarity.

Signup and view all the flashcards

Sᵢⱼ

The score of the optimal alignment between the prefixes a₁…aᵢ and b₁…bⱼ (the first i characters from sequence a and the first j characters from sequence b).

Signup and view all the flashcards

Subproblem

A smaller, independent part of a larger problem that overlaps with other parts and can be solved independently to help solve the larger problem.

Signup and view all the flashcards

Running Best Score

The best alignment score so far as the algorithm builds up the alignment.

Signup and view all the flashcards

Local Alignment

An alignment method that finds the best match between segments of two sequences, instead of the entire sequences

Signup and view all the flashcards

Gap Symbol

A placeholder symbol ('-') used to represent insertions or deletions in sequence alignment.

Signup and view all the flashcards

Match Score

A positive score assigned when two characters are identical in both aligned sequences.

Signup and view all the flashcards

Mismatch Score

A negative score assigned when two characters in both sequences are different.

Signup and view all the flashcards

Dynamic Programming

A technique using a table to store results of smaller subproblems to speed up solving bigger problems.

Signup and view all the flashcards

Affine Gap Penalty

A gap penalty that has a separate score for opening a gap and extending it.

Signup and view all the flashcards

Global Alignment

An alignment method that aligns entire sequences.

Signup and view all the flashcards

Gap-Extension Penalty

Penalty for extending an existing gap in a sequence.

Signup and view all the flashcards

Alignment Score (Local)

Score representing the overall similarity of a sequence by summing all match/mismatch and gap penaltes

Signup and view all the flashcards

Alignment Score (Global)

A numerical representation of the overall similarity of the aligned sequence.

Signup and view all the flashcards

Global Alignment

Finds the best alignment of two entire sequences, considering the entire length of both. The aim is to find the optimal match across the entire strings

Signup and view all the flashcards

Local Alignment

Finds the best alignment of parts of two sequences, focusing on regions of high similarity. Suitable for finding similar subsequences.

Signup and view all the flashcards

FASTA

An algorithm for finding similar sequences in a large database. Primarily used for global alignments.

Signup and view all the flashcards

BLAST

An algorithm for finding similar sequences in a large database, mainly used for local alignments.

Signup and view all the flashcards

Alignment Score

A numerical value representing the similarity between two sequences in an alignment, higher scores mean more similarity.

Signup and view all the flashcards

Scoring Aligned Pairs

Assigning numerical scores to aligned characters in sequences; positive scores for matches, negative for mismatches or gaps.

Signup and view all the flashcards

Dynamic Programming

An algorithm strategy to efficiently solve complex problems by breaking them into smaller, overlapping subproblems and storing and reusing solutions.

Signup and view all the flashcards

Sequence Database Search

Identifying similar sequences in a large database. Crucial for biological discoveries.

Signup and view all the flashcards

Study Notes

Allineamento e similarità di sequenze

  • L'allineamento di due o più sequenze aiuta a trovare regioni simili che potrebbero svolgere la stessa funzione.
  • La similarità tra sequenze può essere definita tramite una funzione distanza: sequenze più simili sono meno distanti.
  • Esistono diversi algoritmi di allineamento, ognuno con la sua funzione distanza.
  • Dato un allineamento, si può assegnare un punteggio (score) che indica il grado di similarità tra le sequenze.

Confrontare sequenze

  • Il confronto tra sequenze nucleotidiche o aminoacidiche è un compito fondamentale della bioinformatica.
  • In natura, le strutture molecolari sono generalmente modificazioni di modelli preesistenti, non create ex novo.
  • Gli obiettivi del confronto includono: filogenesi molecolare, evoluzione dei singoli genomi e caratterizzazione di proteine con funzione sconosciuta

Confrontare sequenze (2)

  • La filogenesi molecolare, tramite il confronto di sequenze nucleotidiche o aminoacidiche, permette di creare alberi filogenetici che mostrano la distanza ed i rapporti evolutivi tra le molecole analizzate.
  • A differenza della filogenesi classica che si basa sulle caratteristiche morfologiche degli organismi, la filogenesi molecolare si concentra sulle relazioni evolutive tra le molecole.
  • La caratterizzazione di proteine con funzione ignota può essere effettuata confrontando la proteina sconosciuta con famiglie di proteine a funzione nota, per formulare ipotesi sulla funzione della proteina sconosciuta.

Similarità e omologia

  • Tra due o più sequenze può esserci un certo grado di similarità, misurabile in modi diversi (a seconda se sono sequenze nucleotidiche o aminoacidiche).
  • La similarità strutturale e funzionale può derivare da una similarità tra sequenze.
  • L'omologia indica una comune origine evolutiva tra sequenze. Due sequenze sono omologhe se discendono da una comune sequenza ancestrale.
  • Due o più sequenze simili non sono necessariamente omologhe.

Omologia e Analogia. Ortologia e Paralogia

  • Omologia indica che due entità (es. due sequenze) condividono la stessa origine filogenetica (provengono da un antenato comune). È un carattere qualitativo.
  • Similarità (o analogia) indica che due entità (es. due sequenze) hanno un certo grado di somiglianza rispetto a un criterio di confronto. È un carattere quantitativo.
  • Ortologia si riferisce a elementi omologhi derivanti da un processo di speciazione.
  • Paralogia si riferisce a elementi omologhi derivanti da un processo di duplicazione genica.

Allineamento di sequenze

  • Per confrontare sequenze nucleotidiche o proteiche, è necessario allinearli.
  • Gli esempi presentano allineamenti multipli di brevi sequenze aminoacidiche.

Allineamento Globale vs. Locale

  • Global alignment: Si cerca la corrispondenza ottimale tra tutte le sequenze.
  • Local alignment: Si cerca di individuare regioni specifiche di similarità all'interno delle sequenze.

Allineamento a coppie (Pairwise Alignment) - Matrici Dot Plot

  • Si crea una matrice per confrontare tutti i possibili appaiamenti tra i caratteri delle sequenze da allineare.
  • La matrice viene riempita annerendo le caselle che contengono la stessa lettera nelle corrispondenti righe e colonne.
  • Sono disponibili programmi come DOTLET che permettono di creare facilmente le matrici dot plot.

Similarità, distanze e matrici di editing

  • La similarità tra stringhe può essere valutata calcolando la loro distanza.
  • Due stringhe con alta similarità sono poco distanti, mentre due stringhe con bassa similarità sono molto distanti.
  • La distanza di editing è il numero minimo di operazioni di inserimento, cancellazione o sostituzione necessarie per trasformare una stringa nell'altra.

La scoring function: similarità e distanza

  • La scoring function assegna un punteggio agli allineamenti, valutando il grado di similarità o distanza tra due stringhe.
  • Un esempio di scoring function assegna un punteggio (+2) per ogni match esatto e (-1) per ogni mismatch o indel.
  • Un altro esempio di scoring function assegna uno score (0) ai match, (1) alle sostituzioni e (2) agli spazi.

La scoring function, più formalmente

  • La scoring function (σ) assegna uno score agli allineamenti dei singoli caratteri o spazi.
  • È possibile costruire scoring function ad hoc per diversi problemi, ad esempio per confrontare aminoacidi, tenendo conto delle loro proprietà chimico-fisiche.

Allineamento di stringhe

  • Si inizia analizzando il problema generale dell'allineamento di una coppia di stringhe.
  • Per allineare due stringhe come "acbcdb" e "cadbd", si cercano allineamenti ottimali.
  • Il carattere "-" rappresenta uno spazio, indicante una cancellazione o inserzione nella sequenza.

Allineamento pairwise(2)

  • Lo score dell'allineamento di una coppia di sequenze è calcolato sommando gli scores dei singoli allineamenti dei caratteri.
  • Un allineamento ottimale è quello che minimizza la distanza o massimizza la similarità tra due sequenze.
  • Gli scores rappresentano il grado di similarità tra sequenze.

Algoritmo di programmazione dinamica

  • Score di nuovo allineamento = Score dell'allineamento precedente + Score della nuova coppia allineata.
  • Si ripetono queste operazioni fino ad arrivare alla fine dell'allineamento.
  • Diagramma che indica le azioni possibili per arrivare alla posizione (i, j) nel diagramma.

Allineamento locale vs. globale

  • Allineamento globale: Si allineano le intero sequenze.
  • Allineamento locale: Si allineano i frammenti di sequenza con massimo punteggio.

Ricerca per similarità

  • BLAST (Basic Local Alignment Search Tool) individua regioni di similarità fra sequenze.
  • BLAST non effettua un allineamento globale ma si concentra sulle regioni più simili.
  • BLAST può confrontare migliaia di sequenze rapidamente.

Come funziona BLAST?

  • BLAST estrae tutte le possible words di lunghezza fissa da una sequenza data.
  • Per ogni word, crea una lista delle possibili parole corrispondenti nella banca dati, basandosi su una soglia di punteggio.
  • Il processo viene esteso (a monte e valle) per trovare un tratto di sequenza con punteggio superiore alla soglia.

NCBI BLAST

  • NCBI BLAST è un'implementazione dell'algoritmo di BLAST.
  • Offre diversi tipi di BLAST (BLASTN, BLASTP, TBLASTN, BL2SEQ) per diversi tipi di confronto.

Altri argomenti

  • Matrici di parole e di punti
  • Analisi di errori nelle parole
  • Significato strutturale delle sequenze

Studying That Suits You

Use AI to generate personalized quizzes and flashcards to suit your learning preferences.

Quiz Team

Related Documents

Description

Questo quiz esplora i concetti fondamentali dell'allineamento delle stringhe e della distanza di editing. Attraverso una serie di domande, il quiz verifica la comprensione delle operazioni di allineamento e delle metriche di similarità. È un ottimo modo per testare le tue conoscenze in materia di algoritmi di stringhe.

More Like This

Python Variables and Data Types Quiz
5 questions
String & Scanner Class Methods Flashcards
17 questions
String Methods in Programming
50 questions
Python Basics: Strings, Comments, Variables
47 questions
Use Quizgecko on...
Browser
Browser