Perché non si vede chiaramente un aeroplano nei filmati del Pentagono?

di Enrico Manieri - Henry62
.
English translation of this post is avaiable here.
.
Questa domanda mi viene spesso fatta da chi si avvicina per la prima volta all’analisi dell’attacco al Pentagono dell’11 settembre 2001.
Cercherò di dare una risposta. Nel libro “Debunking 911 Myths”, nel capitolo 3, viene affrontato l’argomento delle telecamere di sorveglianza del Pentagono e la questione dell’analisi dei filmati rilasciati dal DoD (Dipartimento della Difesa americano) in seguito alla conclusione del processo Moussaoui. .
Questi filmati, fin dal loro rilascio, sono stati oggetto di innumerevoli critiche ed analisi, perché di fatto l’aspettativa del grande pubblico di vedere un aereo schiantarsi contro il Pentagono, in modo simile a ciò che si vede nei numerosi filmati ripresi da diversi angoli dell’impatto del Boeing 767 contro la Torre Sud, è andata delusa.
.
Nel filmato diffuso si vede un impatto, seguito da una deflagrazione e conseguente sviluppo di una enorme nuvola di fiamme, ma di un aereo, così come ci si aspetterebbe comunemente di vederlo, neanche l’ombra. Ma siamo proprio sicuri che si doveva vedere un aereo? Cioè, avremmo davvero dovuto aspettarci di vedere un aeroplano che va ad impattare contro il Pentagono, volando a quota bassissima fino all’impatto finale?
.
Nel libro di Popular Mechanics compaiono queste frasi:
“A Pentagon spokesperson tells Popular Mechanics that the video was taken with a Philips LTC 1261 security camera and recorded at one frame per second. Jerry Housenga is a technical product specialist with Bosch Security Systems, which bought the Philips camera division in 2002. According to Housenga, it was unrealistic to think that the low-quality security camera footage would reveal the crystal-clear image of a Boeing 757 traveling at 780 feet per second. While most advanced security and surveillance cameras can be set to capture real-time video, the attached recording systems are almost always set at signif­icantly slower frame rates in order to conserve storage space. As a result, it is unlikely that the recording system of any nearby security camera would be set at a rate high enough to capture the speeding plane with decent resolution.”
.
L’aeroplano quindi, secondo Popular Mechanics, volava ad una velocità di circa 780 piedi/secondo, cioè pari a 237,9 metri/secondo, cioè, per dare il senso delle grandezze di cui stiamo parlando, con una velocità di 858 chilometri/ora. Le telecamere di sorveglianza del Pentagono che fecero le riprese erano in standard NTSC, quindi producevano 29,97 fotogrammi al secondo con modalità 60i , cioè catturando 60 field al secondo. Ciascun fotogramma (frame) si compone di 2 field o semiquadri. Fino a prova contraria, da quanto risulta finora pubblicamente, si tratterebbe quindi di telecamere analogiche interlacciate funzionanti in standard NTSC, in postazione fissa.
.
In merito alle analisi che seguono, vorrei precisare che ho consultato nel tempo una numerosa quantità di fonti tecniche e parlato con operatori tecnici che lavorano da anni nel settore della produzione audio-video, sia specialisti di TVCC che di produzione/trasmissione video, ma chiedo comunque espressamente a chiunque di non fidarsi delle mie valutazioni e di fare le proprie verifiche su quanto di seguito affermo, passando al vaglio ogni mio dubbio. Facendo invece riferimento ad una fonte ampiamente diffusa tra i navigatori in rete, come Wikipedia per comodità dei lettori, leggiamo:
.
“L'NTSC è un formato interlacciato, dove 60 semiquadri formano 30 fotogrammi al secondo (in realtà la frequenza esatta è di 29,97 al secondo - 60 Hz). La sua risoluzione è di 640x480 pixel
.
Ma per capire il senso della frase, si deve capire cosa sia l’interlacciamento, sempre da Wikipedia:
.
“L'interlacciamento (o interallacciamento) è una tecnica di miglioramento della qualità delle immagini in una trasmissione video, che limita il consumo extra di banda. Consiste nella visualizzazione alternata tra le righe di un fotogramma. Visualizzando l'intero fotogramma e poi passando al successivo, con i tubi catodici si creava uno spiacevole effetto collaterale: poiché il fascio di elettroni che disegnava l'immagine sul tubo partiva dall'alto per arrivare in basso, la parte alta dello schermo risultava più stabile per l'occhio umano, mentre la parte bassa veniva percepita come in costante vibrazione (dato che restava visibile per meno tempo). L'interlacciamento ha permesso di evitare questo. La tecnica consiste nel disegnare sullo schermo prima le righe dispari e poi le righe pari (PAL/SECAM) o viceversa (NTSC). In questo modo la retina dell'occhio dello spettatore viene immediatamente colpita dall'intero fotogramma che viene successivamente (1/50esimo di secondo per il PAL, 1/60esimo per NTSC) colpita dalla righe restanti (sic, N.d.r.). Fu scoperta dall'ingegnere dell'RCA Randall C. Ballard alla fine degli anni '20. È stata utilizzata per i televisori dall'inizio degli anni '70. Effetto collaterale del miglioramento dell'immagine è l'effetto flickering (sfarfallio) che, a volte, rende la visione sgradevole. Oggi, con la nascita prima di tubi catodici che lavoravano a 100 Hz (PAL) e successivamente con l'uso delle tecnologie al plasma e LCD, e con la nascita di formati ad alta definizione, non si rende più necessario trasmettere l'immagine in formato interlacciato. È importante comprendere che l'interlacciamento è una tecnica televisiva e non cinematografica. Un film è necessariamente fatto di fotogrammi "pieni" ed anche se trasmesso in televisione non avrà interlacciamento (cioè le righe dispari e pari saranno relative allo stesso istante) (vedi nota 1, n.d.r.). Oggi è considerata un effetto speciale l'opzione di de-interlacciamento, cioè la rimozione dell'interlacciamento e la creazione (artificiale) di una informazione a fotogramma pieno.”
.
Nota 1: per chiarire quanto afferma Wikipedia, che potrebbe risultare un po’ ostico, è necessario spiegare che il passaggio delle pellicole in formato elettronico viene fatto con una speciale tecnica selettiva, per cui ogni singolo fotogramma della pellicola viene ripreso due volte, in modo che prendendo i field successivi delle coppie di frame, questi sono riferiti sempre al medesimo fotogramma del film. Un ulteriore problema, su cui spesso si sorvola, è che il formato su pellicola lavora a 24 fotogrammi/secondo, mentre il formato video lavora a 25 frame/secondo (PAL) o a 30 frame/secondo (NTSC), per cui, in assenza di adatte correzioni, la durata originale del film varia a seconda del formato video scelto, col formato video più breve di quello su pellicola.
.
Da cui si capisce che, messo in soldoni, l’occhio umano viene ingannato dal rapido succedersi di 60 semiquadri al secondo, traendone la sintesi di immagini in movimento.
. A questo punto non ci resta che capire cosa sia un semiquadro, o field, e ci soccorre sempre Wikipedia, in lingua inglese:
.

“Other technical standards in the final recommendation were a frame rate (image rate) of 30 frames per second consisting of 2 interlaced fields per frame (2:1 interlacing) at 262½ lines per field or 60 fields per second along with an aspect ratio of 4:3, and frequency modulation for the sound signal”

.
e ancora:
.
“With progressive scan, an image is captured, transmitted and displayed in a path similar to text on a page: line by line, from top to bottom. The interlaced scan pattern in a CRT (cathode ray tube) display completes such a scan too, but only for every second line. This is carried out from the top left corner to the bottom right corner of a CRT display. This process is repeated again, only this time starting at the second row, in order to fill in those particular gaps left behind while performing the first progressive scan on alternate rows only. Such scan of every second line is called a field. The afterglow of the phosphor of CRT tubes, in combination with the persistence of vision results in two fields being perceived as a continuous image which allows the viewing of full horizontal detail with half the bandwidth which would be required for a full progressive scan while maintaining the necessary CRT refresh rate to prevent flicker.

Only CRTs can display interlaced video directly — other display technologies require some form of deinterlacing.”

. Quindi si capisce che il field non é altro che l’immagine presa a righe alterne, per cui ogni frame si compone di due semiquadri, ciascuno dei quali mostra solamente le righe pari o le dispari, in maniera che la persistenza dell’immagine nella retina o sul tubo catodico fa ricostituire l’impressione di un frame completo.

Riassumendo, i filmati del Pentagono sarebbero stati ripresi da telecamere che lavorano in modo interlacciato a 60 Hz, cioè con la ripresa di 60 field al secondo per un totale di 29,97 frame al secondo. Detto questo, non sarebbe corretto il paragone concettuale di una telecamera con una macchina fotografica a pellicola, perché a parità di tempo di otturazione (1/60 secondo), la macchina fotografica cattura TUTTA l’immagine su pellicola mentre la telecamera analogica che funziona in modalità interlacciata, cattura di fatto solo un field, cioè o le righe pari o le righe dispari del frame, ma non tutte e due. Ciò deriva dall’elettronica che comanda il funzionamento della telecamera. Il problema che si pone, quindi è capire cosa sarebbe lecito aspettarsi dalla visione su un player di un filmato ripreso da una telecamera analogica, in postazione fissa, di un oggetto in rapidissimo movimento che ne attraversa il campo di ripresa, filmato e salvato su videotape con time lapse recording di 1 frame/secondo e convertito in mpeg1.

. Il problema è complesso, perché si devono distinguere vari passi:

  1. telecamera analogica interlacciata in postazione fissa che riprende;
  2. sistema time-lapse che registra su videocassetta (nell’articolo consideriamo un sistema di registrazione digitale, come ipotesi di sicurezza; se il sistema fosse analogico, la qualità del registrato e del riprodotto sarebbe ancora più bassa);
  3. eventuale esportazione del filmato su altro supporto, per esempio CD-Rom o DVD;
  4. riproduzione del filmato digitale su un player.

La combinazione dei primi tre elementi indicati determina la qualità del filmato digitale distribuito su supporto CD-ROM o DVD, mentre il quarto determina la qualità della percezione del medesimo filmato digitale da parte dello spettatore finale.

. COSA RIPRENDEREBBE LA TELECAMERA?

. Iniziamo ad osservare allora cosa riprenderebbe la telecamera analogica interlacciata in postazione fissa. Le telecamere di sorveglianza del Pentagono che avrebbero ripreso i famosi filmati dell’impatto sarebbero, a meno di nuovi documenti al momento non noti e da quanto risulta al momento, di tipo analogico interlacciate in standard NTSC, a colori, del modello ad iris automatico, con velocità di otturazione di 1/60 secondo. La telecamera inquadra una scena fissa, sfondo e oggetti immobili, e oggetti che si muovono al suo interno (macchine, persone, nuvole e altro), e cattura field alla velocità di otturazione di 1/60 secondo.

Costruiamo un modello semplificato per capire come si comporta l'aeroplano del volo AA77. L’aereo penetra nel campo visivo con la velocità, stimata, per semplificare il modello e non appesantirlo con formule inutili, pari a quella di impatto, di circa 237,9 m/s, secondo una traiettoria che, in prima approssimazione, possiamo ritenere avere un angolo di circa 46° con la retta che congiunge l’aeroplano con la telecamera. In questa ipotesi semplificata, la velocità dell’aereo, punto per punto della traiettoria lineare descritta dall’aeroplano, può essere scomposta nelle due componenti radiali e tangenziali rispetto al centro di un’ipotetica circonferenza con centro nella telecamera e passante per la posizione istantanea dell’aeroplano.

La componente tangenziale della velocità dell’aeroplano è quella che ci dice di quanto si sposterebbbe l’aeroplano per ogni secondo su una linea teorica “quasi-parallela” al piano del CCD che riprende, mentre la componente radiale della velocità ci dice di quanto si avvicinerebbe, nello specifico, l’aeroplano alla telecamera.

In parole povere, la componente tangenziale ci dice di quanto si sposterebbe al secondo l’aeroplano a distanza costante dalla telecamera, mentre la componente radiale ci dice con che velocità l’aeroplano si avvicinerebbe o si allontanerebbe dalla telecamera. La prima sarebbe responsabile di rilevamenti di spostamenti lineari sul CCD della telecamera, la seconda delle variazioni di dimensione dell’oggetto ripreso.

Quindi abbiamo, riassumendo, un oggetto che si sposterebbe nella sua rappresentazione sul CCD e che, contemporaneamente, si avvicinerebbe cambiando le sue dimensioni e la forma della proiezione. Nell’ipotesi semplificata di angolo iniziale di 46°, per OGNI FIELD, cioè ogni sessantesimo di secondo, l’oggetto si sposterebbe dal punto considerato linearmente, in parallelo al CCD, di 2,85 m e si avvicinerebbe di 2,75 m. Cioè, il singolo frame dei 30 al secondo, è composto da righe pari e dispari che si riferiscono ad un medesimo oggetto che si è spostato nella sua proiezione sulla retta parallela al CCD di 2,85 m e che si è avvicinato di 2,75 m. Questo ragionamento estremamente semplificato, vale solamente per il punto iniziale della traiettoria reale, perché per ogni punto della stessa variano sia la distanza dalla telecamera che l’angolo con cui si scompone il vettore velocità, e quindi variano di conseguenza gli spostamenti e le variazioni di dimensioni percepite e registrate dal CCD. E’ chiaro quindi che non è pensabile confrontare una immagine completa scattata a 1/60 di secondo da una macchina fotografica a pellicola con un frame interlacciato catturato da una telecamera analogica interlacciata, in cui le righe pari e dispari dello stesso frame riprendono lo stesso oggetto collocato in realtà diversamente nello spazio. Questo perché le righe pari e le righe dispari dello stesso frame provengono in realtà da field scattati a distanza di 1/60 di secondo.

Man mano che l’aereoplano si avvicina all’impatto col Pentagono, se ammettessimo, per semplicità di modello, la velocità costante dell’aeroplano (ma è un ipotesi riduttiva, perché in realtà l’aeroplano è in fase di accelerazione fisica), diminuirebbe comunque la componente radiale della velocità e aumenterebbe di conseguenza quella tangenziale (per la regola di composizione del parallelogramma dei vettori, secondo le nuove direzioni radiale e tangente su circonferenze concentriche con centro nella telecamera e passanti per il punto in cui si trova l’aereo).

Quindi l’aeroplano, solo per questioni geometriche e non fisiche, subirebbe un’accelerazione tangenziale e una decelerazione radiale rispetto alla telecamera, cioè diminuirebbe l’ingrandimento dell’oggetto percepito dal CCD, ma aumenterebbe lo scostamento fra le posizioni spaziali proiettate sulla parallela al CCD fra le righe pari e dispari dello stesso fotogramma. L’effetto, fuori dal modello, sarebbe ulteriormente amplificato dalla reale accelerazione dell’aeroplano. Già questo fa capire che é difficile attendersi di vedere un aeroplano ben definito come l’immaginario comune potrebbe pensare.

Si pone poi un altro problema: cosa catturerebbe il CCD se nel sessantesimo di secondo in cui resta “aperto” l’otturatore la luce che colpisce il CCD proviene solamente in parte dall’oggetto e in parte dal fondo che resta fisso?

Mi spiego meglio: se ad un certo istante l’otturatore si aprisse per catturare un field (per esempio le righe pari del frame) e considerassimo, sempre per esempio, un punto del campo di ripresa che si trovasse 2,50 metri prima della punta dell’aereo, aereo che si muovesse con velocità tangenziale di 171,1 m/s, questo punto ripreso resterebbe per buona parte del tempo dell’esposizione colpito dalla luce del panorama fisso, e solo mentre l’otturatore sta per chiudersi verrebbe raggiunto dalla punta dell’aeroplano (che, ricordiamo, si sposterebbe in senso tangenziale di 2,85 m).

Cosa registrerebbe, allora, il CCD?

Lo sfondo con una velatura dovuta all’aeroplano che è sopraggiunto quasi in chiusura di otturatore? Probabilmente si; lo stesso effetto lo avremmo per un punto che si trovasse in coda all’aeroplano, in cui all’apertura dell’otturatore avremmo per un brevissimo istante la coda dell’aeroplano, ma poi, per la maggior parte del periodo di esposizione, lo sfondo fisso.

Quindi, riassumendo, avremmo effetti dinamici legati alla geometria fra traiettoria reale dell’aeroplano e punto di ripresa fisso della telecamera, effetti dinamici dovuti alle forze fisiche agenti sull’aeroplano ed effetti “video-elettronici” legati alla modalità di funzionamento e ripresa della telecamera. .

COSA REGISTREREBBE IL VIDEO RECORDER?

. Il sistema di ripresa, come detto, registra le immagini provenienti dalla telecamera, ma per consentire un’adeguata autonomia di tempo, non registra tutti i 29,97 frame NTSC al secondo (ciascuno composto da 2 field), ma registra 1 frame per ogni secondo, secondo un sistema detto time-lapse recording.

Quale fotogramma fra i 30 frame al secondo?

Dipende da come é settato il sistema, ma certamente, ad ogni scadenza del secondo, viene registrato il frame corrispondente.

Sapere come sia settato il registratore é comunque importante, perché i 29,97 frame al secondo sono fra loro molto diversi per “contenuto” dell’immagine.

Che probabilità si hanno di registrare proprio quel frame in cui l’aereo è presente per intero, ammesso che esista un frame siffatto e con tutti i dubbi del punto precedente?

La scrematura selettiva dovuta al time-lapse recording è tale che l’aeroplano, sebbene ripreso dalla telecamera, potrebbe non essere stato registrato, perché facente parte di quei frame che non sarebbero stati considerati dal registratore.

Un ulteriore informazione di cui si dovrebbe avere certezza prima di avanzare ipotesi é la presenza o meno di un apparato di de-interlacciamento del segnale in ingresso prima della registrazione e di eventuale altra circuiteria che potrebbe alterare la struttura dei field registrati rispetto a quelli catturati dalla telecamera.

. COSA VERREBBE ESPORTATO SU CD-ROM O DVD?

. Un ulteriore problema nascerebbe poi dalla successiva esportazione dei frame memorizzati dal videoregistratore a cassette su supporto CD-ROM o DVD.

Visto che il registratore registra 1 frame al secondo dalla telecamera, se venisse riprodotto il filmato registrato (o meglio la serie di immagini registrate) alla normale velocità di 29,97 frame al secondo, avremmo un effetto di accelerazione di 30 volte, per cui i filmati da esportare dovrebbero essere stati ottenuti con tecniche consentite dai normali riproduttori digitali di TVCC con cui è possibile fissare a piacere la velocità di riproduzione, oppure, un’altra tecnica più rozza consisterebbe nel replicare 30 volte ogni singolo frame prima di produrre l’esportazione del filmato.

Il filmato registrato in standard NTSC ha una definizione del singolo frame di almeno 640*480 pixel utili, ma il filmato diffuso dal DoD è in formato MPEG1, che ha una risoluzione del singolo frame di 352*240 pixel, cioè di gran lunga inferiore al formato nativo registrato, ammesso che questo fosse in pieno standard NTSC.

Quindi, oltre a tutti i fattori di cui sopra, nel processo di esportazione si ha, per forza di cose, un ulteriore riduzione della risoluzione dell’immagine, oltre ad una compressione che utilizza un formato lossy, che potrebbe, rispetto all’originale, introdurre una ulteriore complicazione nelle modalità di rappresentazione del singolo pixel.

Sarebbe quindi necessario sapere a quali trattamenti sarebbe stato sottoposto il filmato registrato su videotape prima di esportarlo in MPEG1: per esempio, potrebbe essere stato de-interlacciato.

Una forma brutale di de-interlacciamento e compressione é quella di eliminare completamente un field, lasciando solo o le righe pari o le dispari... Qualcosa sicuramente deve essere avvenuto, visto che il numero delle righe del filmato MPEG1 distribuito é la metà del formato nativo NTSC.

. COSA MOSTREREBBE UN PLAYER?

. E’ chiaro che la qualità del player (hardware e software), condiziona la fruibilità ed il livello finale del filmato MPEG1 rispetto allo spettatore finale. Un conto sarebbe vedere un video-CD, cioè un filmato in formato MPEG1, su un lettore da sala, un altro riprodurre un file MPEG1 in un programma professionale di montaggio video su computer. Ma questi dubbi esulano dalle considerazioni di tipo tecnico sui filmati in sé, anche se, indubbiamente, player diversi forniscono qualità diverse di riproduzione dello stesso file digitale.

. CONCLUSIONI

. Alla luce di queste semplici considerazioni, la mia risposta alla domanda “perché non si vede chiaramente l’aereo del Pentagono nei filmati rilasciati dal DoD?” é che non sapendo:

  • quale sia il livello di dettaglio delle immagini originali su videotape,
  • come sia composta la catena di acquisizione, elaborazione e memorizzazione dei frame (compreso il settaggio delle apparecchiature) ,
  • quali trattamenti abbia subito il filmato prima della compressione MPEG1

non é possibile stabilire con un affidabile grado di certezza quanto la copia in formato MPEG1 sia o meno equivalente all’originale per i contenuti video registrati: l’unica cosa per me certa é che i filmati rilasciati dal DoD sono sicuramente inferiori per definizione e per qualità rispetto agli originali, ed i dubbi tecnici sopra esposti non aiutano certo nel poter avere delle certezze da cui procedere.

Alla luce di tutto quanto affermato, ritengo che sarebbe stato statisticamente più sospetto un filmato che mostrasse chiaramente un aereo impattare contro il Pentagono: i filmati rilasciati dal DoD, a seguito di richiesta FOIA dopo la chiusura del processo Moussaoui, non sono per me una prova conclusiva della presenza o meno di un aereo al Pentagono, ma se dovessi necessariamente scegliere, sono più gli indizi a favore della presenza di un aereo che della sua assenza.

. =<>=

.

DOSSIER "LE TELECAMERE DEL PENTAGONO"

.