Nuovi sviluppi nell'analisi del DNA degradato

di Enrico Manieri - Henry62

.

Automatic Google English translation can be found here

.

La tragedia degli attacchi dell'11 settembre 2001 pose le autorità americane davanti al terribile dilemma di dover rinunciare alla possibilità di identificare tutte le vittime oppure di dare un impulso senza precedenti alla ricerca nel settore dell'identificazione genetica, per cercare di attibuire un nome non solo ad ogni vittima, ma ad ogni singolo resto individuato fra le macerie.

In particolare, il problema più arduo da affrontare fu quello di poter analizzare del materiale genetico che era stato deteriorato dal tipo di offesa che i corpi avevano subito in vita e dalla prolungata permanenza fra le macerie in ambiente ostile, oltre che dai normali processi di decadimento organico.

A temperature prossime ai 95°C, il DNA umano inizia a deteriorarsi, cioè a spezzare i legami fra le basi che lo compongono, quindi non è più utilizzabile per la mappatura con tecniche tradizionali.

Nel caso peggiore di corpo carbonizzato, a meno che i tessuti non siano completamente carbonizzati, è comunque spesso possibile rintracciare negli strati più interni o in particolari posizioni più protette dal calore (come il midollo all'interno delle ossa di maggior spessore oppure la polpa all'interno dei denti) delle cellule da cui poter estrarre del materiale genetico ancora in grado di fornire informazioni da analizzare.

.

Negli articoli del Dossier "Le vittime dell'11 settembre" ho cercato di illustrare sia le principali tecniche adottate per identificare le vittime, sia la tragica situazione e le indiscutibili difficoltà in cui si trovarono ad operare le squadre dei soccorritori che ebbero il triste compito di passare al setaccio le macerie per raccogliere ogni singola prova e resto di vittima, per poter procedere poi alla ricomposizione dei resti, essenzialmente mediante tecniche di identificazione genetica.

In questo articolo voglio invece esaminare gli sviluppi che proprio la tragedia dell'11 settembre ha portato nell'analisi e nell'identificazione dei resti degradati dei corpi carbonizzati.
Per poter entrare nel dettaglio del progresso avvenuto dopo l'11 settembre nel settore dell'analisi del DNA degradato, è necessario premettere alcune nozioni senza le quali sarebbe impossibile addentrarci nel difficile settore dell'identificazione genetica.

.

- LA CELLULA ED IL CORREDO GENETICO -

.

La cellula è l'elemento base dei tessuti che costituiscono il corpo umano ed ogni essere vivente ed è delimitata da una membrana cellulare. A seconda della presenza o meno di un nucleo distinto al suo interno, la cellula si definisce rispettivamente eucariote (nucleo presente ed individuato da una membrana che lo racchiude) o procariote (nucleo assente).
All'interno della cellula è presente il citoplasma, una massa colloidale in cui sono distribuiti alcuni tipi di strutture come i lisosomi, il reticolo endoplasmatico, i ribosomi, l'apparato di Golgi, i centrioli ed i mitocondri.

Brevissimamente, possiamo dire che i lisosomi rappresentato l'equivalente dell'apparato digerente della cellula, cioè sono le strutture che, tramite enzimi, provvedono alla demolizione di proteine, carboidrati e lipidi.

Le materie prime così ottenute vengono reimpiegate dalla cellula per ricostituire i propri componenti del citoplasma.

I lisosomi vengono creati dall'apparato di Golgi per gemmazione, cioè tramite un processo di riproduzione molto semplice e veloce che è tipico della specie più primitive, come per esempio i lieviti ed i funghi. Il reticolo endoplasmatico è una zona citoplasmatica in cui sono presenti delle strutture tubolari e membranose ripiegate su loro stesse, a costituire un complesso insieme di cisterne e condotti. Questa struttura cellulare si differenzia in reticolo liscio e reticolo rugoso (detto anche granulare o ruvido); il reticolo liscio è un insieme di tubuli che sintetizzano i lipidi e gli ormoni steroidei ed è il principale attore del metabolismo cellulare del glicogeno. Il suo compito, inoltre, è quello di rendere innocue per la cellula delle sostanze che potrebbero portarla a morte, come per esempio l'etanolo. Un altro compito importante è quello di costituire un serbatoio di ioni calcio, che, nei tessuti muscolari, servono per la contrazione della cellula.

Il reticolo granulare ha questo nome perchè la sua superficie citoplasmatica fa da sostegno ai ribosomi, organi sferoidali che sono presenti anche nel citoplasma ma che si addensano sulle pareti del reticolo, punteggiandone la superficie. Questo reticolo ruvido è quindi importante per la presenza dei ribosomi, che sono gli organi cellulari addetti alla sintesi proteica. L'apparato, o organo, di Golgi è una struttura reticolare costituita da sacche membranose, il cui scopo è sintetizzare i carboidrati modificando proteine e lipidi, per andare a costituire le molecole che saranno destinate ad essere liberate dalla cellula verso l'ambiente esterno ad essa.

I centrioli sono delle strutture deputate essenzialmente alla facilitazione della divisione cellulare; hanno l'aspetto di tubuli organizzati in nove triplette, ripiegati su loro stessi a formare dei foglietti di filamenti. Normalmente sono disposti in coppie fra loro ortogonali, a creare una struttura chiamata centrosoma.

I mitocondri, la cui importanza ai nostri fini sarà chiarita successivamente, sono l'equivalente dell'apparato respiratorio della cellula. Le funzioni da loro espletate sono della massima importanza, dalla produzione di energia alla produzione del colesterolo.

Secondo una teoria che reputo affascinante, i mitocondri deriverebbero dall'incorporazione nella cellula di primitivi batteri che ne avrebbero infettato il citoplasma.

Per questo motivo, i mitocondri sono dotati di un proprio corredo genetico, racchiuso in strutture di DNA dalla forma ad anello.

All'interno della cellula, in particolare nel nucleo e nei mitocondri, è presente quindi il materiale genetico, cioè il corredo di informazioni, codificate chimicamente, che determinano le caratteristiche ereditarie degli esseri viventi.

Nel suo complesso, questo corredo prende il nome di genoma, cioè l'insieme dei geni che caratterizzano l'individuo.

Il genoma umano è costituito da un numero elevatissimo di geni (circa 80.000 secondo il Dizionario Medico RCS), contenuti in massima parte nelle 23 coppie di cromosomi omologhi, formazioni interne al nucleo costituite da DNA (acido desossiribonucleico) e proteine su cui il filamento a doppia elica del DNA è avvolto.

A questa regola generale fanno eccezione i gameti, cioè le cellule germinali deputate alla riproduzione dell'essere umano, che contengono 23 cromosomi anzichè 23 coppie.

Il numero e la morfologia dei cromosomi prende il nome di cariotipo; nell'essere umano sono presenti 22 coppie di cromosomi non sessuali (autosomi) e una coppia di cromosomi sessuali, che nel maschio sono del tipo XY mentre nella femmina sono di tipo XX.

L'elemento costitutivo del materiale genetico prende il nome di nucleotide, che è costituito da una sequenza di tre elementi: una base azotata, uno zucchero (desossiribosio) e un gruppo fosfato.

Le basi azotate sono cinque, di cui solo quattro presenti nel DNA, mentre la quinta, l'uracile, è presente nel solo RNA.

Le basi azotate del DNA sono Adenina e Guanina (conosciute come Purine), Citosina e Timina (dette anche Pirimidine).

La combinazione fra le basi del DNA avviene unicamente secondo i seguenti accoppiamenti fissi:

.

Adenina <=> Timina

Guanina <=> Citosina

.

- STRUTTURA E REPLICAZIONE DEL DNA -

.

Come accennato, il DNA è presente sia nel nucleo della cellula che nei mitocondri.

La struttura del DNA del nucleo è complessa e allo stesso tempo mirabile nella sua geometrica perfezione.

La sequenza e la composizione dei nucleotidi codifica i dati ereditari che caratterizzano l'individuo, cioè, in altre parole, l'informazione genetica è stabilita dalla sequenza delle basi all'interno del filamento di DNA.

Quando la cellula si riproduce, il patrimonio genetico viene duplicato per effetto dell'azione di enzimi, attraverso un meccanismo noto come replicazione del DNA.

L'elica del DNA si apre ed i filamenti "genitori" si separano; in una sorta di processo di stampaggio, ciascun filamento funge da "matrice" per la creazione di un filamento "figlio", che, in virtù della univocità di legame fra le coppie di basi azotate, sarà in tutto e per tutto complementare al filamento "genitore".

Se "A" e "B" sono i filamenti genitori, ciascuno di questi darà origine, rispettivamente, a filamenti figli "b" ed "a", copie esatte dei genitori "B" ed "A".

In questo modo il DNA si replica esattamente uguale a se stesso e la nuova cellula avrà un patrimonio genetico identico alla cellula di partenza.

Una sequenza di tre nucleotidi codifica una "parola" genetica, detta codone, che definisce a sua volta un aminoacido, cioè il mattoncino costitutivo delle proteine.

Gli aminoacidi conosciuti nelle proteine umane sono 20; con 4 basi prese a gruppi di 3 elementi, si possono formulare 64 diversi possibili gruppi (4^3) perciò alcune triplette codificano lo stesso aminoacido, motivo per cui il codice genetico viene detto ridondante.

In termini generali si può affermare che una tripletta individua sempre un solo aminoacido, anche se un aminoacido può essere codificato da più triplette fra loro diverse.

Per definire il punto di fine codifica all'interno del gene, sono disponibili 3 possibili codoni di stop, cioè tre gruppi di basi che vengono interpretate come fine della catena di codifica; queste triplette sono le seguenti: TAA, TGA e TAG (T= Timina, A= Adenina e G=Guanina).

.

- LA REAZIONE A CATENA DELLA POLIMERASI -

(PCR - POLYMERASE CHAIN REACTION)

.

La PCR è una tecnica di laboratorio che viene utilizzata per l'amplificazione dei frammenti di DNA ed il suo utilizzo è fondamentale per l'analisi del DNA degradato.

Si tratta di una vera e propria tecnologia di amplificazione dei frammenti di DNA, che vedremo in termini molto semplificati, dato che ci interessa in principio di funzionamento e non certo la complessa tecnicalità che la caratterizza.

Per poter svolgere esami sugli acidi nucleici è necessario poter disporre di una certa quantità di campione, ma spesso ciò non è possibile nell'indagine genetica forense.

Questa tecnica consente quindi di aumentare la quantità di materiale a disposizione per l'analisi garantendo, al contempo, che il contenuto informativo del codice genetico ad esso abbinato non vari nell'operazione o, peggio, possa essere inquinato fornendo risultati errati.

A Kary B. Mullis, ideatore nel 1983 di questa tecnica, venne attribuito il premio Nobel per la Chimica nel 1993.

In pratica questa tecnica riproduce parzialmente la replicazione del DNA che avviene durante la riproduzione della cellula, cioè si basa sulla creazione di un tratto di filamento completo di DNA a partire da un segmento a singola elica, a sua volta derivato dalla demolizione termica o chimica del DNA originario (DNA degradato).

Sfruttando il meccanismo naturale della replica del DNA, il tratto mancante di DNA viene riassemblato prelevando i nucleotidi da un bagno in cui sono presenti in termini elementari, per essere assemblati secondo la sequenza complementare a quella codificata dal DNA deteriorato. La base della tecnica è l'uso, in determinate condizioni di temperatura e di tipologia di ambiente, di enzimi detti DNA-polimerasi, che si attivano in natura per sintetizzare un filamento di DNA a partire solamente da un filamento a singola elica (cioè denaturato, in cui i legami fra le basi omologhe sono stati spezzati - la doppia elica è stata aperta) ed in presenza di nucleotidi di tipo dNTP (desossiribonucleotidi trifosfati) da cui prelevare i mattoncini elementari per la polimerizzazione.

Questo processo porta al prolungamento del filamento originale, non alla sua creazione completa a partire dai nucleotidi, in altre parole consente l'amplificazione di un DNA degenerato esistente, non la sua creazione da zero.

Un'altra fondamentale condizione che deve essere soddisfatta è la conoscenza degli estremi del segmento di DNA che deve essere replicato.

Gli enzimi DNA-polimerasi si attivano solamente in presenza di particolari punti di innesco, detti in gergo primer, che servono per poter far partire il processo di amplificazione differenziando il tipo di estremo del segmento di DNA.

Nelle strutture basate sullo zucchero (pentosio), ciascun estremo dei cinque disponibili del filamento è denominato con un numero progressivo e tale numero identifica anche la posizione disponibile per un legame chimico, così si dice che gli estremi di un filamento sono del tipo 3' (tre primo) perchè in questa posizione è presente un gruppo OH che può essere legato al vertice in posizione 5' (cinque primo) di un altro filamento, dove è presente un gruppo fosfato legato al carbonio dello zucchero.

Il senso 3'-5' è quindi opposto al senso 5'-3' e tale descrizione è sufficiente per definire il senso in cui si sviluppa il filamento di DNA.

Se si vuole interrompere il meccanismo di amplificazione del DNA sarà quindi sufficiente far legare al filamento un gruppo privo del vertice 3'-OH ed in tal modo l'amplificazione a catena si blocca per mancanza del punto su cui costituire il legame, oppure utilizzare un gruppo privo del 5'-fosfato per bloccare comunque la reazione.

E' importante sottolineare che l'enzima DNA-polimerasi potrebbe anche non appartenere allo stesso organismo di cui si vuole amplificare il DNA degenerato; la DNA-polimerasi umana viene completamente distrutta per effetto termico già a temperature di 96-99°C, cioè alle temperature necessarie per la rottura della doppia elica del DNA ("denaturazione del DNA"), per cui si ricorre ad enzimi prelevati da batteri che vivono in ambienti caratterizzati da temperature elevate (batteri termofili), in cui tali enzimi non vengono disattivati dalle alte temperature.

In particolare, si ricorre alla Taq-Polimerasi, cioè all'enzima di DNA-polimerasi del batterio Thermus aquaticus, che vive nelle pozze di acqua ad alta temperatura di sorgenti naturali surriscaldate o di geyser.

L'enzima di questo batterio è caratterizzato da elevata termo-stabilità e questa sua caratteristica lo rende ideale per la completa automatizzazione della tecnica della PCR in cicli successivi, senza alcuna aggiunta di nuovo enzima ad ogni denaturazione (ciò elimina la possibilità di inquinamento del campione).

.

- IL DNA MITOCONDRIALE (mtDNA) -

.

Come già ripetutamente accennato, il DNA umano è presente nel nucleo, raggruppato nei cromosomi, e nei mitocondri. In ciascuna cellula sono presenti più mitocondri.

A differenza del nucleo, quindi, anche in presenza di condizioni difficili per la conservazione del materiale genetico, il mtDNA ha maggiori probabilità di essere recuperato in condizioni utilizzabili per l'analisi, proprio perchè presente in più copie all'interno di ogni singola cellula.

Approfondiamo allora la conoscenza del DNA mitocondriale (mtDNA - mitochondrial DNA).

All'interno del mitocondrio sono contenute 16.569 coppie di basi azotate in 5-10 anelli di DNA, che definiscono 37 geni.

Questo patrimonio genetico è ereditato per via matrilineare, cioè il figlio (maschio o femmina)eredita il materiale genetico mitocondriale dalla sola madre, quindi il corredo genetico del mitocondrio da una generazione all'altra si trasmette in modo quasi identico fra madre e figli, a differenza del DNA nucleare che deriva per il 50% dal padre e per il 50% dalla madre.

Per questo motivo, a meno di mutazioni cui il DNA mitocondriale è comunque più esposto di quello nucleare, il genoma mitocondriale fra madre e figlio/a è perciò quasi uguale.

In questo modo è possibile identificare i legami di sangue fra la madre ed i propri figli, anche procedendo a ritroso fra le generazioni.

Il DNA mitocondriale della nonna materna sarà il medesimo della madre e quindi dei figli da essa generati.

Questa sostanziale invarianza del DNA mitocondriale è utilizzato anche in analisi genetico-archeologiche, in cui è possibile risalire per linea femminile al corredo genetico di popoli ormai scomparsi.

In medicina forense l'uso del mtDNA non è molto diffuso, per l'estrema delicatezza della sua analisi, ma nel caso di corpi degradati da incendi la tecnica di analisi del mtDNA è in grado di fornire ottimi risultati, laddove l'analisi del DNA nucleare non è invece realizzabile per lo stato di degrado del campione genetico.

E' importante sottolineare che nel processo di creazione dell'embrione, sia il corredo genetico mitocondriale del padre che quello della madre vengono all'inizio ricevuti nella cellula uovo, ma, in seguito ad un processo di metabolismo cellulare, i mitocondri provenienti dal padre vengono in un secondo momento selezionati e distrutti.

Le moderne tecniche di inseminazione in vitro potrebbero portare a delle alterazioni in questo processo di selezione del patrimonio genetico e quindi, nel caso di inseminazioni artificiali, questa matrilinearità del mtDNA potrebbe essere messa in discussione, con DNA del mitocondrio nei figli proveniente sia dal padre che dalla madre.

Da un punto di vista cellulare, il fatto che il mtDNA sia racchiuso nel mitocondrio assicura una maggiore protezione termica al DNA e, soprattutto, viene impedita la dispersione del campione genetico nel citoplasma.

L'ipotesi, ampiamente confermata da studi specifici, che, per l'essere umano maschio o femmina, il mtDNA sia ereditato in natura dalla sola madre ha quindi consentito una particolare tecnica di analisi che va a valutare il sequenziamento delle basi in particolari regioni ad alta variabilità del DNA (cioè in zone dove esiste un'elevatissima probabilità che individui di madre diversa abbiano sequenze di codice genetico molto diverso, chiamate HVR1 o HVR2), costituite da 440 paia di basi azotate che sono utilizzate per operare confronti fra mtDNA di diversi individui (anche contenuti in basi dati genetiche) per verificare l'esistenza di una linea di familiarità materna.

In questo modo, per esempio al Pentagono, è stato possibile accertare la presenza di materiale genetico proveniente da due diversi individui, entrambi di stirpe medio-orientale per la presenza di elementi genetici tipici di quell'area geografica, ma aventi il medesimo mtDNA a fronte di diversa mappa del DNA nucleare: ciò significa che i due individui, nello specifico due fra gli attentatori presenti sul volo AA77, condividevano lo stesso patrimonio genetico mitocondriale, cioè erano fratelli, figli della stessa madre biologica che aveva trasmesso loro il proprio patrimonio genetico mitocondriale.

Solo per assonanza, ricordo che una analisi per via patrilineare (cioè per sola linea paterna) è possibile, per i soli individui maschi, tramite la sequenzializzazione del cromosoma sessuale Y, assente nelle femmine, che viene quindi trasmesso dal padre al solo figlio maschio.

.

- L'IDENTIFICAZIONE GENETICA PRIMA DELL'11 SETTEMBRE -

.

L'identificazione dell'impronta genetica può essere ottenuta attraverso numerose tecniche di analisi, scoperte negli anni '90 dello scorso secolo e che si basano su principi di test fra loro diversi.

.

- Analisi RFLP -

(Restriction Fragment Length Polymorphism)

.

Questa tecnica di analisi, laboriosa e che richiede grandi quantità di campione da esaminare, si basa sul principio di operare dei tagli sul filamento di DNA in presenza di determinate sequenze di basi, mediante l'utilizzo di specifici enzimi che riconoscono solamente quelle precise sequenze di basi.

In pratica, il filamento di DNA viene tagliato in tratti che possono essere composti da un numero variabile di nucleotidi, a seconda dell'enzima utilizzato per operare il taglio.

La lunghezza delle zone di taglio può variare da 2 a 12 coppie di basi : è ovvio che maggiore è la lunghezza della zona di taglio, minore è la probabilità di un errore.

Una volta operati i tagli, i frammenti restanti di DNA del filamento originale vengono separati in base alla loro lunghezza, tramite un processo di elettroforesi.

La lunghezza dei frammenti così ottenuti varia da individuo ad individuo (polimorfismo) e questa particolarità può essere utilizzata, oltre che per identificare l'individuo, anche per accertare i legami di parentela, dato che le caratteristiche genetiche si trasmettono da genitori a figli.

Utilizzando la tecnica PCR e nucleotidi resi radioattivi, è possibile ottenere delle mappe radioattive che marcano in modo univoco la struttura del DNA.

Con questa tecnica è possibile ottenere una mappa dei Variable Number Tandem Repeats (VNTRs), cioè delle zone in cui si ripetono da 4 a 40 volte le stesse sequenze di nucleotidi della lunghezza variabile da 14 a 100 nucleotidi.

Il test viene effettuato su diversi cromosomi; dato che la lunghezza e la posizione dei VNTRs variano da individuo ad individuo e, per lo stesso individuo, variano a seconda della posizione nel DNA paterno rispetto a quello materno, la probabilità che due individui abbiano la stessa mappa è praticamente nulla.

Nel caso di tessuti diversi dello stesso corpo, le mappe dei campioni devono essere identiche perchè il test sia positivo, mentre nel caso di analisi di ereditarietà la mappa esaminata deve essere uguale a quella dei singoli genitori nei campioni di DNA di provenienza materna e paterna.

Esistono due tipi di VNTRs:

  • minisatelliti : sono sequenze di 11-16 basi che si ripetono 1.000 volte, diffuse in buona quantità in tutto il genoma umano. Sono presenti in 60 posizioni specifiche dei cromosomi non sessuali (autosomi);
  • microsatelliti o STR (Short Tandem Repeats) : sono sequenze di 100-200 basi generate dalla ripetizione di sequenze formate da 1 a 6 basi. Questi STR, relativamente scarsi nel genoma, vengono amplificati con la tecnica PCR per essere sottoposti ad analisi. L'esame di parentela con questa tecnica deve essere ristretto all'esame di un unico cromosoma, con un allelo proveniente dalla madre ed uno dal padre.

.

- Analisi PCR -

(Polymerase Chain Reaction)

.

E' una tecnica di analisi che si basa sul meccanismo già illustrato della amplificazione del DNA, dove però il materiale campione di analisi proviene da specifiche zone dei cromosomi e viene amplificato usando dei marcatori fluorescenti, che si combinano per la ricostituzione del filamento di DNA.

Con questa tecnica, per cui esistono in commercio dei kit di analisi del polimorfismo di un singolo nucleotide (SNPs), è possibile effettuare analisi su quantità molto piccole di campioni, anche degradati termicamente, perchè questi vengono rigenerati e amplificati per mezzo della tecnica PCR.

.

Sebbene molto veloci e pratici nell'uso, questi kit sono particolarmente utili per operare riconoscimenti di tessuti dello stesso individuo o per fare confronti con basi dati genetiche nel caso di disastri con un elevato numero di vittime, ma nella pratica forense non vengono utilizzati quando si tratta di esaminare campioni organici misti provenienti da individui diversi (come, per esempio, nei casi di stupro, in cui liquido seminale si trova mescolato a cellule provenienti da tessuti vaginali).

.

- Analisi AmpFLP -

(Amplified Fragment Length Polymorphism)

.

Questa tecnica si basa sull'uso della PCR per amplificare selettivamente alcune zone del campione ed utilizza i VNTRs per l'analisi degli spezzoni di DNA ottenuti dopo il taglio.

Gli estremi dei segmenti ottenuti dopo il taglio vengono successivamente marcati con specifici primers, destinati a creare a loro volta delle nuove zone di taglio dopo una amplificazione.

In questo modo vengono generati spezzoni di DNA che possono essere analizzati tramite un processo di elettroforesi su gel per andare a generare delle mappe del DNA con elementi fluorescenti o radioattivi.

Maggiori dettagli su questo metodo, piuttosto complesso come meccanismo ma che si presta ad una elevata automazione, possono essere letti su questo documento.

.

- Analisi STR -

(Short Tandem Repeats)

.

Anche in questo caso si tratta di un metodo di analisi basato sull'amplificazione di porzioni di DNA caratteristiche per il loro polimorfismo, all'interno delle quali vengono ricercate delle sequenze brevi di 4 o 5 nucleotidi.

Il DNA così amplificato viene lavorato tramite tecniche di elettroforesi, in modo da consentire l'individuazione delle sequenze.

L'uso di sequenze brevi è particolarmente indicato nel caso di DNA degradato, perchè stringhe di soli 4-5 nucleotidi resistono con maggior probabilità di sequenze più lunghe alla demolizione termica del DNA, pur mantenendo un elevato grado di individuazione in virtù delle specifiche caratteristiche di elevato polimorfismo delle zone di DNA amplificate.

Negli Stati Uniti è stato adottato uno standard di identificazione individuale basato su 13 settori principali del genoma (loci) da cui estrarre campioni di DNA da sottoporre ad analisi tramite STR e che, memorizzati in banche dati a livello locale e nazionale, costituiscono il "Combined DNA Index System" (CODIS), la banca dati dei profili di DNA rilevati nei luoghi di reato gestita dal FBI per i confronti basati sull'esame del DNA, in cui sono memorizzati i dati di quasi 5 milioni di individui.

In Inghilterra si è invece deciso di operare su 10 loci diversi del genoma, andando ad alimentare una banca dati del DNA che è fra le più importanti al mondo (la "UK National DNA Database" - NDNAD - che contiene i dati di più di quattro milioni di individui e che cresce al ritmo di 30.000 nuovi profili criminali al mese).

.

- Analisi Y-STR -

(Y-Chromosome Analysis)

.

E' l'analisi STR applicata allo studio delle zone ad alto polimorfismo del solo cromosoma sessuale Y.

Questo cromosoma è trasmesso dal padre ai soli figli maschi e la sua analisi può essere utilizzata sia per l'identificazione individuale che per l'analisi di paternità.

.

- Analisi mtDNA -

(Mitochondrial Analysis)

.

L'analisi del DNA mitocondriale viene svolta essenzialmente in presenza di DNA nucleare troppo degradato, tale per cui risulti impossibile rilevare i 13 loci standardizzati dell'analisi STR per il confronto con la banca dati CODIS.

Il vantaggio principale del mtDNA è che in ciascuna cellula esistono numerosi mitocondri e quindi più copie probabilmente disponibili del genoma mitocondriale.

Come sappiamo, il mtDNA viene ereditato dalla madre, per cui è possibile operare un'identificazione certa di un individuo a partire da un confronto delle zone HV1 e HV2 con il mtDNA di un fratello, figlio biologico della stessa madre, della madre, oltre che da campioni dell'individuo prelevati da spazzolini da denti, capelli, peli e biopsie oppure dal mtDNA della nonna materna o da zii materni.

In pratica ogni individuo ha mtDNA identico a quello della madre, della nonna materna e di tutti i parenti provenienti dal ramo ereditario materno.

Questo tipo di analisi si presta anche all'uso su campioni organici molto degradati, come nel caso di resti fossili.

Sfruttando questo meccanismo, è stato possibile individuare la madre genetica, chiamata "Eva mitocondriale", cioè tracciare i diversi rami evoluzionistici che hanno un unico riferimento storico in una antenata comune definita "Eva mitocondriale", il cui patrimonio genetico mitocondriale si è trasmesso con poche variazioni nelle generazioni da lei discendenti in modo matrilineare.

Questo tipo di analisi, estremamente affascinanti, sono campo di ricerca sia per la genetica che per l'archeologia e l'antropologia.

.

- L'IDENTIFICAZIONE GENETICA DOPO L'11 SETTEMBRE - .

L'attacco dell'11 settembre non ha precedenti, in termini di numero di vittime, nella storia americana e il tipo di offesa arrecata fu quanto di più complesso da gestire perchè sommò in sè gli effetti sovrapposti e composti di offese di tipologia diversa: impatto meccanico, esplosione con elevato gradiente termico e barico, incendi diffusi prima e dopo il crollo, precipitazione sia all'esterno che all'interno dei grattacieli (pochi sanno che la tragedia del WTC è anche stato il più grave incidente per numero di vittime che coinvolse l'uso di ascensori, con intere cabine cariche di passeggeri che precipitarono nei vani da altezze elevatissime), crollo di piani e quindi degli interi edifici, dilavamento delle macerie e dei corpi delle vittime con ritardanti chimici per il controllo degli incendi e con acqua degli idranti pompata dal fiume Hudson e, da ultimo, decomposizione organica per attacco di batteri e per l'avanzare dei processi putrefattivi.

Tutti questi effetti comportarono un'elevatissima frammentazione dei corpi delle vittime: solamente 293 corpi furono rinvenuti in condizioni tali da poter essere identificati senza ricorrere ad esami strumentali (fonte: Simpson e Stehr - "Victim management and identification after the WTC collapse").

Oltre 20.000 resti organici furono sottoposti a test genetici per essere identificati; solo la metà circa di questi era in condizioni di poter essere esaminati con le tecniche tradizionali di analisi utilizzate nel 2001 .

Per poter operare il confronto genetico erano necessarie all'epoca delle sequenze non deteriorate di almeno 400 paia di basi, cosa che per le condizioni terribili del disastro del WTC e del Pentagono si rivelò essere molto difficile da avere. Per questo motivo vennero appositamente sviluppati test più raffinati in grado di discriminare sequenze di sole 100 coppie di basi, pur a fronte di un costo economico maggiore e, soprattutto, di tempi notevolmente dilatati rispetto allo standard.

La mobilitazione delle società e dei laboratori operanti nel settore della genetica fu massiccia, così come la spinta di università e centri di ricerca, oltre che delle istituzioni governative, per lo sviluppo di nuove metodologie di marcatori da utilizzare nell'ambito delle procedure standard di tracciatura del profilo genetico o di più semplice discriminazione di campioni all'interno di basi dati di comparazione predefinite e costituite sia da campioni di materiale genetico dei familiari delle vittime, che da tessuti riferibili alle vittime e prelevati dalle loro abitazioni (capelli, peli e cellule dei tessuti orali) o da campioni organici conservati da speciali banche degli organi (sangue, seme, cordone ombelicale, embrioni, campioni di sangue per screening di malattie metaboliche ed ereditarie, paptest e biopsie).

Il dott. Robert Shaler era il responsabile dell'identificazione delle vittime del WTC ed il suo compito apparve fin da subito estremamente complesso, quasi impossibile da completare.

Il governatore dello Stato di New York, George Pataki, già una settimana dopo la tragedia dispose per un allargamento dei laboratori specializzati nell'analisi genetica da utilizzare a supporto dell'opera del dott. Shaler, ma lo stato dell'arte della tecnologia di riconoscimento genetico non era all'epoca tale da poter garantire il risultato sperato dalle autorità.

Consci di questo pesante limite, gli enti preposti cercarono allora di sperimentare nuovi innovativi approcci al problema.

La via naturale da seguire fu quindi quella di aumentare il potere di risoluzione dei marker utilizzati per effettuare la mappatura dei loci caratterizzati da elevato polimorfismo: in pratica, il problema consisteva nel riuscire ad individuare l'individualità della singola persona (cioè la sua specifica e statisticamente univoca variazione polimorfica del codice genetico dei loci analizzati) utilizzando stringhe sempre più corte del materiale genetico.

Lo stesso dott. Shaler diede il suo appoggio a questo tipo di approccio e nel novembre del 2001 l'ufficio da lui diretto chiese al NIST che venisse dato il massimo impulso possibile alla ricerca sui nuovi indicatori genetici, chiamati miniSTR, condotta dal dott. John Butler (qui una interessante intervista allo stesso dott. Butler), in modo che in tempi brevissimi questa nuova tecnica di individuazione genetica potesse dare un contributo nell'opera di identificazione dei resti a Ground Zero.

John Butler e Susan Ballou al lavoro

nel laboratorio di Genetica del NIST

Il gruppo di ricercatori, sotto la spinta dell'emergenza nazionale, concretizzò il frutto di ricerche durate anni e fra il dicembre 2001 ed il gennaio 2002 presentò delle conclusioni operative che consentirono la fase di sperimentazione della tecnica del miniSTR nell'opera di soccorso, i cui primi passi si mossero nel marzo-aprile 2002 presso i laboratori del Bode Technology Group che già stavano eseguendo i test sui reperti del WTC.

Fra il 2002 e l'estate 2003 furono condotti studi di validazione della nuova tecnica, che venne presentata alla comunità internazionale nell'ambito di pubblicazioni e convegni specialistici di genetica.

Il culmine di questa attività viene toccato nell'aprile 2004, quando Butler è invitato a partecipare ai lavori del European DNA Profiling Group (EDNAP) e del European Network of Forensic Science Institutes (ENFSI) sul tema dell'analisi del DNA degradato.

Una interessante presentazione delle possibilità offerte dalla nuova tecnica dei miniSTR è disponibile qui.

Il primo comunicato commerciale relativo alla disponibilità di kit per l'analisi del DNA con l'uso di indicatori miniSTR è dell'ottobre 2005, fatto dalla Applied Biosystems, che successivamente sviluppa e commercializza, a partire dal 2007, il Minifiler Kit basato sui miniSTR che è stato perfezionato tenendo conto della enorme esperienza accumulata nei lavori di riconoscimento delle vittime del WTC.

Due documenti fondamentali sui miniSTR sono i seguenti: "New STR loci under development by the NIST Forensic/Human Identity Project Team" , sviluppato dal gruppo di ricerca presieduto da John Butler, e "Characterization of new miniSTR loci to aid analysis of degraded DNA" a firma di Coble e Butler, che fissa nuovi standard nell'uso della tecnica dei miniSTR.

Una timeline completa della tecnica dei miniSTR può essere consultata presso questo indirizzo.

.

- LE BASI DATI GENETICHE -

.

La tragedia dell'11 settembre, con le sue catastrofiche dimensioni in termini di perdita di vite umane, ha evidenziato la necessità di poter disporre di basi dati adeguate su cui poter effettuare dei controlli di identità.

Se nel caso del Pentagono il riconoscimento delle vittime militari è stato facilitato dall'avere già per molti di loro il possesso di campioni di sangue, nel caso delle vittime civili il problema si è posto in tutta la sua gravità.

Al World Trade Center il balletto delle cifre delle potenziali vittime fu incessante fin dai primi giorni seguiti all'attacco e solamente i componenti delle squadre di recupero della DMORT capirono esattamente le dimensioni della tragedia e l'immane lavoro che sarebbe spettato ai team di identificazione e ricomposizione dei resti delle vittime.

La complicazione principale del lavoro di identificazione genetico a New York fu l'eterogeneità di provenienza delle vittime: nazionalità diverse, razze diverse e l'assenza di precisi elenchi che consentissero di limitare la necessità di fare confronti su basi dati resero fin da subito improbo sia il lavoro puramente tecnico di analisi che, soprattutto, quello organizzativo di contatto fra le diverse ambasciate e la direzione delle squadre di identificatori biologici.

In numerosi casi le squadre riuscirono a ricongiungere i resti di un unico individuo, ma in assenza di elementi univoci di confronto, non si riuscì ad attribuire un nome alla vittima.

Parte del materiale organico recuperato a Ground Zero, soprattutto frammenti di ossa, è tuttora conservato in appositi sistemi di congelamento che ne garantiscono la lunga durata di conservazione, in attesa che l'evoluzione delle tecniche di analisi ne consenta un giorno l'associazione al nome di un disperso.

Per poter associare un nome ai resti, le mappe genetiche ricavate dai singoli campioni dovevano essere confrontate con quelle del materiale genetico ricavato da effetti personali delle vittime, rinvenuti nelle loro abitazioni, come capelli o peli presi da pettini e rasoi, cellule del cavo orale ricavate da spazzolini da denti, campioni di liquidi organici depositati presso banche degli organi - sacche di sangue per autotrasfusioni, biopsie, paptest, sangue catameniale su indumenti igienici.

Altri campioni provenivano da parenti con vincoli di sangue, sia ascendenti che discendenti.

Per tutti i riconoscimenti nacque l'esigenza di operare confronti ripetuti fra un gran numero di campioni raccolti in appositi database.

Come già accennato, esistono delle apposite banche dati del DNA relative ai casi criminali in cui del materiale organico è stato rinvenuto nel corso delle indagini, ma nel caso delle vittime degli attacchi dell'11 settembre tali banche dati non poterono essere di grande aiuto.

A livello di ricerca, invece, esistono delle banche dati che supportano l'attività dei genetisti, provvedendo alla distribuzione capillare delle informazioni.

Si distinguono in:

  • banche dati primarie: banche dati di sequenze di acidi nucleici che contengono informazioni generiche atte all'identificazione delle sequenze utili per individuare la specie e la funzione. Fra le banche dati primarie ricordiamo l'europea EMBL Datalibrary del laboratorio europeo di biologia molecolare di Heidelberg; l'americana GenBank e la giapponese DDBJ;
  • banche dati specializzate: sono banche dati delle sequenze proteiche che contengono informazioni sulla struttura codificante proteine e aminoacidi. Fra le più importanti si ricorda la svizzera SWISSPROT, l'europea TREMBL, che contiene la traduzione in aminoacidi delle sequenze presenti nella banca dati primaria EMBL e l'euro-americana PIR (Protein Information Resource), realizzata dalla americana Georgetown University in collaborazione con la tedesca MIPS di Monaco di Baviera.

Altri tipi di banche dati genetiche sono invece mirate alla ricerca di domini proteici, cioè di sequenze non perfettamente identiche di basi ma che possono essere individuate come simili da appositi marcatori e algoritmi di ricerca, oppure da confronti di pesi molecolari della sequenza codificante.

Esistono numerosi tipi di banche dati, specializzate per finalità di ricerca, ma in generale sono afflitte da un problema di ridondanza, cioè dalla presenza di codifiche duplicate per le medesime informazioni a causa della mancanza di standardizzazione e normalizzazione degli inserimenti di dati.

In Europa un contributo importante alla standardizzazione delle banche dati genetiche è dato dal European Network of Forensic Science Institutes (ENFSI) che, in collaborazione con il European DNA Profiling Group (EDNAP), sta sviluppando una più forte integrazione delle banche dati per consentire una maggiore possibilità di comparazione dei profili genetici.

Attualmente esistono 7 STR loci definiti secondo standard Interpol e condivisi fra tutti i laboratori di genetica forense europei ai fini della comparazione genetica.

Maggiori informazioni sulle banche dati genetiche possono essere trovate in questo documento.

.

- AUTOMATIZZAZIONE DELLE IDENTIFICAZIONI GENETICHE -

.

La scienza che si occupa dell'informatizzazione della ricerca genetica è la bioinformatica.

La potenza di calcolo dei moderni elaboratori e lo sviluppo di hardware specifici per le analisi genetiche hanno consentito ai biologi molecolari la decodifica dei complessi codici genetici associati alle sequenze del DNA in tempi estremamente rapidi.

Questa innovazione è stata fondamentale per l'effettuazione di un enorme numero di identificazioni di resti umani ritrovati fra le macerie delle Twin Towers e del Pentagono, dato che lo stato di questi resti non era tale da consentirne l'identificazione con le altre tecniche tradizionali descritte in questo articolo.

Oltre alla fase prettamente di ricerca di decodifica della funzionalità dei geni, la bioinformatica ha ricevuto un forte impulso anche dalla necessità di condivisione delle informazioni per il tramite delle reti informatiche e dalla esigenza di archiviare, in modalità facilmente fruibile, enormi quantità di informazioni, come interi genomi di organismi e, primo fra tutti, il genoma umano.

L'informatizzazione delle risorse ha però anche facilitato enormemente lo svolgimento delle analisi operative, in particolare l'operazione di sequenziamento del DNA per la creazione delle mappe genetiche.

Un secondo fondamentale apporto dell'automazione è la riduzione della possibilità di errore nell'esecuzione dei test, oltre alla riduzione del rischio di inquinamento dei campioni.

Le attuali curve di qualità si attestano su livelli impensabili fino a pochi anni fa.

Questo rapidissimo sviluppo tecnologico ha portato alla nascita di una nuova figura professionale, il bioinformatico, cioè il biologo che alle specifiche conoscenze in campo genetico associa un elevato skill informatico.

Parallelamente allo sviluppo di hardware specializzato, grande attenzione è stata dedicata anche all'implementazione di software specializzati all'elaborazione dei test e all'immagazzinamento delle informazioni da questi ricavati.

Sono così nati dei software di sequenzializzazione delle sequenze di nucleotidi degli acidi nucleici (DNA e RNA).

I risultati del sequenziamento genetico vengono inseriti quotidianamente in banche dati di profili a disposizione degli investigatori ed in banche dati specializzate ad uso dei ricercatori.

Dopo l'11 settembre tutte questi settori avanzati della bioinformatica hanno ricevuto un impulso enorme, che ha portato alla focalizzazione di investimenti mirati al raggiungimento di obiettivi molto concreti ed in tempi brevi.

Secondo un metodo da sempre diffuso negli Stati Uniti, ditte private, università ed enti statali hanno realizzato uno sforzo comune per conseguire gli obiettivi designati.

Un esempio importante di questa sinergia è il Polonator, un apparato sequenzializzatore di geni a basso costo che potrà rendere accessibile questo tipo di analisi anche a laboratori di piccole dimensioni.

E' interessante sottolineare che molti italiani emigrati negli USA si sono messi in luce con brillanti intuizioni che sono state immediatamente brevettate da università e aziende, garantendo così un flusso continuo di finanziamenti per gli studi nel settore delle biotecnologie.

In particolare, mi piace segnalare il nome del giovane ricercatore Francesco Stellacci, la cui invenzione ha tutte le potenzialità per abbattere in maniera decisiva i costi dell'analisi genetica.

.

=<>=
.
Dossier " LE VITTIME DELL'11 SETTEMBRE "
.