Le telecamere del Pentagono: segnale video e sua memorizzazione

di Enrico Manieri - Henry62
.
E' ora il momento di passare ad analizzare cosa succede alla nostra immagine elettronica dopo che è stata "catturata" dal CCD ed è stata inviata all'elettronica di controllo della telecamera.


Prima di procedere col discorso, è bene riprendere un concetto fondamentale che deriva dall'analisi svolta in questo articolo: in generale, maggiore è il numero di pixel del CCD, migliore sarà la qualità dell'immagine, ma, a parità di numero di pixel, l'immagine in bianco e nero sarà molto più definita della medesima immagine a colori ripresa dal medesimo CCD unico. Come ricorderete, ciò nasce dal fatto che in una ripresa in bianco e nero ogni pixel del CCD cattura esattamente i fotoni che lo colpiscono e produce, per effetto fotoelettrico, una quantità di carica proporzionale al numero di fotoni da esso effettivamente ricevuti.

Questa quantità di carica viene quindi trasformata in tonalità di grigio ed ogni pixel ha in sè le informazioni necessarie e sufficienti per restituire un valore di grigio che andrà a comporre un pixel dell'immagine elettronica.

Nel caso invece della ripresa a colori con un solo CCD, come nella stragrande maggioranza dei prodotti di tipo consumer esistenti sul mercato e per tutte le telecamere dei sistemi TVCC, il concetto di pixel si stempera nel concetto di "quadrante": il singolo pixel non ha più in sè l'informazione per restituire un dato che rappresenti la realtà ripresa, ma si deve utilizzare una matrice quadrata di 2x2 pixel in cui sono presenti 2 pixel che ricevono luce verde (collocati in diagonale) ed 1 pixel ciascuno destinati a ricevere rispettivamente la luce blu e la luce rossa.

Il valore cromatico finale di ciascun pixel dell'immagine deriva quindi da un processo statistico di interpolazione spaziale dei colori, per cui, a parità di CCD, l'immagine a colori ha risoluzione molto inferiore rispetto a quella in bianco e nero.

Normalmente il produttore delle telecamere, per ovvi motivi di marketing, dichiara solamente il numero massimo di pixel, senza fare queste distinzioni e, chiaramente, il valore mostrato è sempre quello riferito a immagini in bianco e nero.

Nel caso poi di telecamere portatili di relativamente recente produzione, non tutti i pixel effettivamente disponibili sul CCD vengono utilizzati per produrre punti attivi ai fini della generazione dell'immagine finale, ma si utilizzano solo quelli di un'area rettangolare all'interno del CCD (circa l'85% dell'area del CCD), con una "cornice cuscinetto" di pixel su tutti i lati che viene utilizzata dal software per realizzare una stabilizzazione elettronica dell'immagine, in grado di eliminare o comunque attutire gli effetti fastidiosi delle piccole vibrazioni della telecamera che dovessero manifestarsi durante la ripresa (in pratica, l'immagine "utile" può spostarsi di qualche pixel in tutte le direzioni e l'elettronica di controllo è comunque in grado di sterilizzare l'effetto di questi spostamenti del CCD, senza influire su quelli del soggetto ripreso).

Il problema che si pone, quindi, è quello di capire esattamente cosa accade alla nostra immagine (che ricordo essere un field, nel caso di CCD con funzionamento interlacciato) quando deve essere fatta uscire dalla generica telecamera per essere inviata, tramite un cavo, ad un apparato di visualizzazione (schermo tv) o di memorizzazione (tipicamente un registratore a cassette analogico).

Per le telecamere di sorveglianza analogiche, il sistema di trasmissione più comune prevede l'invio di un segnale composito, mediante cavi anche di grande lunghezza. L'immagine prodotta dal CCD, quindi, subisce delle trasformazioni durante la sua vita: il CCD è uno strumento analogico, ma l'immagine letta proviene da un passaggio di discretizzazione delle cariche elettriche, cioè da una prima digitalizzazione.

Successivamente, l'elettronica della telecamera deve approntare un segnale video da inviare via cavo e per far questo provvede ad una nuova riconversione in analogico dell'immagine digitale ottenuta in precedenza: tutti questi passaggi non avvengono a costo zero, ma ad ogni operazione diminuisce il livello qualitativo dell'immagine.
Riassumendo:
  • il CCD funziona in modo analogico;
  • la carica di ciascun pixel viene discretizzata in fase di acquisizione dal CCD all'elettronica di controllo (prima conversione: da analogico a digitale);
  • elaborato il segnale elettrico digitale, questo viene riconvertito in video composito, cioè analogico, per la trasmissione via cavo (seconda conversione: da digitale ad analogico);
La trasmissione analogica del segnale video avviene scomponendo l'immagine non in pixel (unità con cui invece lavorano i sistemi digitali), ma in linee video.
Banalizzando molto, sui cavi viaggiano in modo seriale gruppi di informazioni relative alle variazioni di luminosità e colore di una linea orizzontale di punti, non le singole informazioni dei pixel.
Facendo allora riferimento alle linee tv, è possibile dare le seguenti definizioni:
.
  • risoluzione orizzontale = numero di linee verticali che compongono l'immagine a schermo

  • risoluzione verticale = numero di linee orizzontali che compongono l'immagine a schermo

ricordando però che, in realtà, le linee verticali NON esistono nel segnale, perchè l'immagine viene codificata solo per linee orizzontali.
Solamente la successiva rappresentazione delle linee orizzontali sullo schermo video fa nascere il concetto astratto di linea verticale, che poi si è diffuso nell'uso comune.
Per non dare adito a discontinuità fastidiose per la visione, le linee orizzontali sono parzialmente sovrapposte in modo che sullo schermo video l'immagine in movimento possa essere vista come un continuum (un indicatore di questo parametro è il cosiddetto "Kell factor" : nel caso di telecamera a CCD un valore coerente è 0,9 ).

Chiarite queste definizioni, allora si può tornare a parlare delle caratteristiche di una telecamera anche in termini di risoluzione di una telecamera, definita in questo modo:
  • risoluzione di una telecamera = numero di linee tv verticali che la telecamera è in grado di produrre
La telecamera del Pentagono, per esempio, era una Philips LTC 1261/21, del tipo analogico, interlacciata, con un unico CCD a colori, con risoluzione di 480 TVL (tv lines).


Ciò significa che ciascuna linea orizzontale di video, il cui numero è definito dallo standard NTSC, si compone al massimo di 480 campionamenti e questo valore non ha assolutamente niente a che vedere con il numero di pixel che compongono il CCD, anche se è chiaro che la qualità dell'immagine è tanto migliore quanto maggiori sono il numero di pixel del CCD e la risoluzione della telecamera.

Riassumendo, quindi, le telecamere, come ogni altro prodotto audio-video, lavorano secondo standard audio-video codificati, in modo da poter funzionare correttamente al variare dei singoli componenti della catena di elaborazione del segnale: lo standard europeo più diffuso è il PAL (in Francia il SECAM), mentre nel mercato americano si usa il formato NTSC (acronimo di National Television Systems Committee), tutti sono definiti come di tipo field-based (cioè l'unità elementare non è il fotogramma ma il field - "Il video NTSC è un formato "field-based" di 59.94 FIELD al secondo. Un Field è la più piccola parte del formato Video. 2 Fields diventano 1 FRAME. Quindi, questi 59.94 FIELD al secondo equivalgono a 29.97 FRAME al secondo").

Secondo le specifiche NTSC per la trasmissione a colori, l'immagine si compone di 525 linee orizzontali, di cui solo 486 visibili: le linee dalla 21 alla 263 costituiscono il primo field, mentre le linee dalla 283 alla 525 definiscono il secondo field. La frequenza reale di visualizzazione dei field è 59,94 Hz, normalmente definita 60 Hz per comodità di linguaggio.

Non è quindi corretto sostenere, come fecero a suo tempo altri autori, che la telecamera del Pentagono fosse una "full-frame NTSC" perchè forniva una risoluzione di 480 linee tv, visto che la definizione di risoluzione in linee della telecamera si riferisce alle linee VERTICALI, non a quelle orizzontali e lo stesso concetto di "full-frame", nel modo utilizzato da questi autori, sarebbe da chiarire, perchè di non univoco significato.

Quegli autori, infatti, fecero confusione fra le 480 TVL della risoluzione della telecamera (numero di linee verticali) con il numero di linee orizzontali definito dallo standard NTSC - per combinazione o scelta della Philips i due numeri coincidono in valore assoluto, ma le analogie finiscono qui.

Per meglio spiegare questo concetto, introduco una definizione empirica di risoluzione di una telecamera:

"la risoluzione di una telecamera è il numero massimo di punti che, disposti su una stessa riga orizzontale, vengono visti come separati l'uno dall'altro, occupando l'intera riga orizzontale".

Con questa definizione, del tutto equivalente a quella tecnica ma molto più comprensibile, si capisce che la telecamera del Pentagono poteva mostrare, su una linea orizzontale, un massimo di 480 punti fra loro distinti.

Facendo un esempio, se noi pensassimo ad una linea tv orizzontale come ad una riga punteggiata, questa riga sarebbe composta di 240 punti bianchi su fondo nero, dato che la somma dei punti bianchi con quelli neri deve fare 480.

- CONCLUSIONI -

Come detto, il numero di linee orizzontali dello standard NTSC è di 525 linee, di cui solo 486 visibili (le altre vengono utilizzate per trasmettere informazioni per la riproduzione o servizi accessori - per esempio il Televideo, se ci fosse, viaggerebbe in questi gruppi di linee non visibili), con una definizione dell'immagine pari a 720 pixel orizzontali per 480 pixel verticali, ma la telecamera del Pentagono risolveva solo 480 linee verticali, a fronte dei 720 pixel presenti sul lato orizzontale dell'immagine.

Ciò significa che la ricostruzione dell'immagine analogica tramite linee di segnale avveniva con un numero di campionamenti orizzontali (variazioni di luminosità e colore) che, sebbene di buona quantità, era logicamente inferiore a quello dei pixel equivalenti della medesima immagine digitalizzata proveniente da una trasmissione standard NTSC.

In pratica, il numero di linee orizzontali di un frame NTSC è di 486 linee visibili, cioè la risoluzione verticale di un frame è di 486 linee tv, mentre la risoluzione effettiva, visto che le linee orizzontali si sormontano parzialmente, si ottiene moltiplicando la risoluzione verticale per il "Kell factor" (0,9).

Dato che il formato video NTSC è 4:3, per avere una equivalente risoluzione effettiva orizzontale del frame sarebbe necessario avere:

486* 0,9 *4 /3 = 584 linee tv verticali

ma la telecamera del Pentagono ne forniva solo 480!

Quindi l'immagine generata dalla telecamera del Pentagono NON aveva, a livello di frame, la stessa definizione orizzontale e verticale, sia in termini di linee tv che di risoluzione effettiva (considerando il Kell factor).

Si potrebbe allora obiettare che la telecamera lavorava secondo uno standard interlacciato, quindi la risoluzione reale in senso verticale del frame derivava dalla sovrapposizione dei due diversi field interlacciati, per cui la risoluzione verticale del frame deve essere considerata in realtà come ridotta del 50 %.

Questo è vero, ma nel caso di un field il rapporto dell'immagine non è più il canonico 4:3 del frame, ma 4:1,5, cioè un frame dimezzato in altezza a parità di larghezza, e quindi la risoluzione orizzontale avrebbe dovuto essere:

243 (risoluzione verticale di un field) * 0,9 *4/1,5 = 584 linee tv verticali

Cioè la risoluzione orizzontale equivalente resta invariata, come logico attendersi dal fatto che la metà delle righe orizzontali deve comporre un'immagine alta la metà.

E' importante sottolineare il fatto che, a causa dell'interlacciamento, gli oggetti che restano fissi in due field successivi vengono rappresentati con una risoluzione verticale che, nel dominio spazio-tempo, è doppia di quelli in movimento, dato che gli oggetti in movimento vengono ad occupare posizioni diverse in tempi diversi e, quindi, nei due field, sono rappresentati solamente con le righe pari in un field e con le righe dispari nel successivo, ma in posizioni diverse.

Quindi, in conclusione, resta dimostrato che la telecamera del Pentagono NON era in grado di riprendere immagini con la medesima risoluzione orizzontale e verticale e, in pratica, ciò si traduce in una sensibile minore definizione dell'immagine in senso orizzontale anche rispetto agli oggetti verticali fissi.

Questo fatto non altera le proporzioni degli oggetti nella rappresentazione, però ne determina sicuramente un peggiore livello di dettaglio in direzione orizzontale (circa il 20% in meno), per cui un oggetto in rapido movimento in direzione orizzontale (per esempio l'aereo del volo AA77) si troverebbe ad essere "penalizzato" in termini di dettagli (cioè variazioni di luminosità e/o colori) tanto più quanto è maggiore la sua velocità.

E' del tutto improponibile, quindi, operare confronti in assoluto fra la definizione degli oggetti verticali ed orizzontali della stessa immagine, senza tener conto di questa particolarità della telecamera (per esempio, non ha alcun senso fare un'analisi del timone dell'aereo senza considerare che la componente orizzontale è del 20% circa meno definita rispetto a quella verticale - si badi bene, anche ad oggetto fermo!
Si dovrebbero poi considerare gli effetti derivanti dalla composizione del movimento rapido, della scansione interlacciata e del segnale interlacciato).

Si deve quindi ricordare, come già accennato, che l'immagine standard NTSC si compone di 480 x 720 pixel, per cui la risoluzione effettiva dell'immagine, tenendo conto del fattore Kell, diviene di 438 righe orizzontali (486 * 0,9) e 480 righe verticali (effettivamente fornite dalla telecamera), che vanno però a generare rispettivamente 480 e 720 pixel, quindi in senso orizzontale avremo, di fatto, un'ulteriore scadimento della risoluzione dell'immagine e del dettaglio (ulteriore peggioramento del 33%), mentre in senso verticale lo scadimento per questa "diluizione" dei campioni sui pixel sarà del 9%.

Questo è un risultato fondamentale ed innovativo, dato che finora non era mai emerso dalle analisi fatte da chicchessia sui filmati del Pentagono.

Il significato di tutto ciò è piuttosto evidente: la medesima inquadratura, con gli stessi soggetti ripresi, può essere ricostruita con un numero diverso di campioni e, logicamente, quanto maggiore è questo numero di campioni, tanto migliore sarà la qualità dell'immagine (che però risente sempre e comunque di tutto quanto illustrato in merito al principio di funzionamento del CCD a filtro di Bayer).

Nella gamma di produzione Philips, illustrata dalla tabella che segue, si possono vedere su fondo giallo i dati della telecamera del Pentagono, mentre su fondo bianco quelli di altri modelli contemporanei della Philips, sia in standard NTSC che PAL.

E' solo il caso di evidenziare il dato della risoluzione della telecamera, che giustamente la Philips definisce come "Horizontal resolution" (cioè numero di linee verticali - come promemoria, si ricordi che se si parla di risoluzione "horizontal" ci si riferisce alle linee tv verticali, se invece si parla di "vertical", ci si riferisce alle linee tv orizzontali) e sottolineare come le telecamere possano fornire 330, 380, 480 e 570 linee verticali, sempre a parità del numero di linee orizzontali, che viene invece fissato dallo standard televisivo NTSC o PAL di appartenenza, a seconda dei modelli.


Una volta sul cavo di trasmissione, il segnale viaggia verso l'apparato di visualizzazione o di registrazione: indipendentemente dalla risoluzione delle telecamera, sia gli apparati di visualizzazione (schermo tv) che di registrazione (video registratori a cassetta) hanno una loro risoluzione intrinseca, dettata dalla banda passante, che condiziona la qualità di ciò che viene visualizzato o registrato.

Normalmente la risoluzione di schermi tv e videoregistratori è inferiore a quella prodotta dalle telecamere, per cui la risoluzione finale di un sistema è comunque dettata, come numero di linee, dall'apparato della catena di utilizzo che è collocato alla fine della catena, ma la qualità di ciascuna linea risente del livello del segnale in ingresso, per cui è buona norma avere telecamere che forniscano in uscita una risoluzione maggiore degli apparati destinati a ricevere in ingresso il segnale.

Naturalmente anche la telecamera di sorveglianza del Pentagono utilizzava lo standard NTSC.

Quando però questo segnale viene registrato su cassetta magnetica, entra in gioco la banda passante dell'apparecchiatura utilizzata e del supporto magnetico.

Nel caso del VHS la banda passante è 3 MHz, che consente di registrare con una risoluzione orizzontale di 240 linee a colori e 330 in bianco e nero.

Un formula empirica per la determinazione del numero di linee a colori consentite da una apparecchiatura, nota l'ampiezza della banda passante in MHz, è la seguente:

n° linee tv verticali = 80 x banda passante in MHz

All'aumentare della banda passante (definita dallo standard di registrazione adottato), migliora la risoluzione orizzontale: così, per esempio, il S-VHS ha una banda di 5 MHz che gli consente una risoluzione di 400 linee verticali, mentre il formato digitale DV arriva a 500 linee tv.

Il filmato del Pentagono, quindi, è stato prodotto da una telecamera che già non aveva la medesima risoluzione in senso orizzontale e verticale, ma soprattutto è stato registrato su supporto magnetico che, nel caso molto probabile di formato analogico VHS a colori, riduce ulteriormente le linee verticali a 240...
.
=<>=
.
Resta ora da analizzare un ultimo passo, cioè la conversione del segnale da analogico a digitale nella codifica MPEG, utilizzata dal DoD per la diffusione del video dell'impatto di AA77 contro il Pentagono.

=<>=
.

DOSSIER "LE TELECAMERE DEL PENTAGONO"
.