Una profonda comprensione della relazione tra mutazioni genetiche nel virus e risposta immunitaria nell'organismo colpito è di primaria importanza nello sviluppo di vaccini efficaci a specifiche varianti del virus influenzale.
La formulazione di una teoria che sappia associare la risposta immunologica all'evoluzione filogenetica del virus posa sulla definizione di una distanza genetica, calcolata tra sequenze di amminoacidi, che sia capace di quantificare la diversità antigenica tra i corrispettivi patogeni.
Nonostante il largo successo scientifico ottenuto dai modelli attuali nello studio della dinamica delle infezioni virali, in molti casi la metodologia usata poggia su distanze genetiche che si limitano a contare il numero di mutazioni, tralasciando la loro posizione nelle catena amminoacidica. Diverse sono le idee che puntano invece a riconoscere schemi modulari nelle mutazioni, ed alla formulazione di una distanza genetica suscettibile della variazione semantica apportata a livello globale dalla singola mutazione puntuale.
Un esempio chiarirà il concetto. Immaginiamo di parlare di parole anziché di sequenze amminoacidiche, e di significato anziché di patogeno virale. Prendiamo per esempio le due parole "cane" e "pane", queste, secondo una distanza genetica classica, hanno distanza 1, perché c'è solo una mutazione che le distingue. Immaginiamo ora di cambiare casualmente l'ordine delle lettere nelle parole, ma nello stesso modo in entrambe, ottenendo le due nuove parole "aenp" e "aenc". La distanza genetica classica tra esse è ancora 1, tale distanza è invariante alla modifica dell'ordine e risulta dunque incapace di riconoscere che le due nuove parole non hanno più alcun significato.
E' importante formulare una distanza genetica capace di percepire la variazione nel significato (ossia nella struttura del virus) a partire dalla variazione nella sequenza di lettere (cioè di amminoacidi).
Nel grafico è visualizzata l'evoluzione genetica dell'emoagglutinina (HA) del virus influenzale appartenente alla famiglia H3N2. (clicca sul grafico per visualizzare lo studio nel dettaglio)
L'emogglutinina è una glicoproteina antigenica presente sulla superfice del virus ed è responsabile, insieme alla neuraminidasi, dell'adesione del virus nalla cellula destinata a essere infettata. Per questo motivo essa è riconosciuta dal sistema immunitario e la più soggetta alla deriva genetica.
L'analisi è basata sulla teoria sviluppata in ambito accademico da Riccardo Scalco, Mario Casartelli e Raffaella Burioni all'Università di Parma. Le diverse sequenze amminoacidiche, tratte del database GISAID, sono state confrontate le une alle altre mediante una distanza genetica definita dalla mutua entropia condizionale di Shannon tra partizioni in spazi astratti di probabilità. Si assume che tale distanza sia capace di osservare cambiamenti biologicamente rilevanti nella ridisposizione degli amminoacidi proposta dall'evoluzione del virus. E' già stato osservato come l'evoluzione emergente dalla analisi proposta sia in ottimo accordo con la storia epidemiologica del patogeno virale.
La lettura del grafico è la seguente. Ogni sequenza amminoacidica HA, associata a un isolato (ossia un virus estratto dal sangue di un paziente), è individuata da un punto colorato. La posizione del punto nell'asse delle ascisse indica la data di isolamento, mentre la posizione sull'asse delle ordinate permette di raggruppare tra loro isolati appartenenti, secondo la distanza genetica usata, alla medesima sotto-famiglia. In altre parole, isolati appartenenti a sotto-famiglie differenti hanno differenti posizioni nelle ordinate. Il colore ha unicamente utilità visiva, permettendo un più facile riconoscimento delle sotto-famiglie.
E' possibile fare alcune importanti osservazioni. Una prima osservazione è che ogni stagione invernale vede le presenza di più sotto-famiglie, una delle quali è di solito preponderante, mentre le altre sono o sotto-famiglie già apparse gli anni precedenti, e che stanno via via scomparendo, oppure sotto-famiglie nuove, mai apparse prima.
L'analisi suggerisce inoltre che è tra queste nuove sotto-famiglie che va ricercato il virus preponderante della stagione avvenire. E' infatti facile osservare che talvolta la sotto-famiglia principale di una data stagione presenta dei precursori già nelle stagioni precedenti.
- Burioni R, Scalco R, Casartelli M. Rohlin Distance and the Evolution of Influenza A Virus: Weak Attractors and Precursors. PloOne 2011. DOI: 10.1371/journal.pone.0027924
- Pybus O, Rambaut A. Evolutionary analysis of the dynamics of viral infectious disease. Nat Rev Genet 2009; 10: 540–550.
- Recker M, Pybus O, Nee S, Gupta S. The generation of inuenza outbreaks by a network of host immune responses against a limited set of antigenic types. Proc Natl Acad Sci USA 2007; 104: 7711–7716.
- Hamming R. Error detecting and error correcting codes. Bell System Technical Journal 1950; 29: 147–160.
- Khinchin A. Mathematical Foundations of Information Theory. Dover, New York, 1957.
- Sito dello studio