Cerca
  • Sicurezza
  • Scenario

Telecamere professionali di sorveglianza: come funzionano

Telecamere professionali di sorveglianza: come funzionano

Il primo blocco funzionale che incontriamo quando si tratta di implementare un impianto professionale di videosorveglianza fa riferimento alla ripresa,  demandata alla, o più spesso alle, telecamere – il punto di inizio da cui parte l’intero processo. La loro funzione può essere paragonata a quella dell’occhio umano – ovvero quella di vedere/catturare quello che entra nel suo campo di visione il più chiaramente possibile. Quindi di convertirlo in un segnale, o insieme di dati, che possano essere trasferiti ai sistemi che stanno a valle che devono poi operare sugli stessi: registrarli per visioni future, visualizzarli per interpretarne il significato e/o ritrasmetterli ad un punto remoto per, ad esempio, condividerli.

Le telecamere professionali di videosorveglianza sono organi alquanto complessi che possono essere scomposte in:

  • gruppo di ottiche
  • sensore di immagine
  • elettronica di elaborazione, controllo e gestione

Le ottiche

Le ottiche delle telecamere di videosorveglianza hanno il compito di convogliare il segnale luminoso proveniente dal campo di ripresa sul sensore ottico che deve poi tradurre i segnali luminosi in informazioni elettroniche elaborabili.

Le caratteristiche funzionali delle ottiche, del sensore e del loro accoppiamento sono quelle che determinano i parametri funzionali più importanti del sistema telecamera: il campo di visione e la risoluzione.

Il sensore

Il sensore è il componente elettronico, realizzato su una piastrina di Silicio, che consente di trasformare l’immagine proiettata sulla sua superficie in un segnale analogico o in un flusso di informazioni digitalizzate. La tecnologia oggi dominante è quella CMOS che ha soppiantato la tecnologia CCD (Charge Coupled Device) che, fino a qualche hanno fa, era l’unica scelta possibile.

Su questa piastrina di silicio sono allineati, in forma matriciale, dei piccolissimi (1.2 μm × 1.2 μm) sensori fotosensibili – denominati pixel (contrazione di Picture Element) che trasformano la quantità di luce ricevuta in una quantità di carica elettrica e quindi in un valore di tensione proporzionale.

Nella figura vediamo, a sinistra, un esempio concettuale di una piccola porzione di un sensore in cui i pixel sono rappresentati dai piccoli cubetti grigi sormontati dai cubetti colorati del filtro (il filtro di Bayer) che consente di ottenere immagini a colori. La circuiteria elettronica di contorno alla matrice di pixel, una volta acquisita l’immagine, si preoccuperà di emettere in sequenza opportuna tutte le informazioni relative all’immagine acquisita.

Il sensore, o meglio la parte della matrice di pixel sensibili, può avere dimensioni e risoluzioni (numero di pixel) diverse. Le dimensioni – definite ‘formato ottico’ – vengono normalmente riferite alla diagonale dell’elemento e riportata in pollici: per esempio 1/3.6″, 1/3.2″, 1/3″, 1/2.7″, 1/2″, 1/1.8″, 2/3″, 1″.

La matrice del sensore di immagine di cui stiamo parlando sarà anche caratterizzata dalla quantità di pixel che supporta e normalmente citato come L ´ H dove L e H sono la larghezza e l’altezza, espresse in numero di pixel.  Su questo fronte si passa dal piccolissimo formato da 320 ´ 240 = 76.800 pixel fino al formato da 5.632 x 4.224 = 23.789.568 (ovvero 23,8 MP).

Focale e angolo di campo

Di fronte al sensore c’è il blocco delle ottiche che ha la funzione di adattare al meglio l’ambiente che si vuole ritrarre al sensore stesso.  Nel caso più semplice questo blocco si riduce ad essere una sola lente, normalmente biconvessa.  Una lente positiva o convergente focalizza un fascio collimato parallelo all’asse in un punto focale, a distanza f dalla lente, detta distanza focale. Questo parametro, combinato con la dimensione del sensore di immagine, determina l’angolo di campo.

Viene considerato “normale” un obiettivo che consente una riproduzione dell’ambiente vicina a quella dell’occhio. Questo si ottiene con una lunghezza focale approssimativamente uguale alla diagonale del sensore di immagine.

Per esempio, per le fotocamere da 35 mm è il 50 mm l’obiettivo considerato normale. In quel caso il sensore di immagine era la pellicola da 24×36 mm che ha diagonale di 43,3 mm.

Prendendo come riferimento la focale pari alla diagonale del sensore gli obiettivi con focale minore vengono definiti grandangoli – cioè hanno un angolo di campo più largo – mentre quelli con focale superiore vengono chiamati teleobiettivi ed hanno un angolo di campo più ristretto. (vedi figura).

La formula per calcolare l’angolo di campo convenzionale è: Adc = 360/p ´ arctan(d/2f) dove d è la diagonale del sensore ed f è la lunghezza focale.

Nella tabella sono riportati gli angoli di campo ottenibili combinando la dimensione del sensore con la focale dell’obbiettivo.

Angolo di campo in funzione di focale e dimensione del sensore -LUMI4INNOVATION

Angolo di campo della videocamera - LUMI4INNOVATION

Come calcolare la focale della videocamera

Nello schema di figura 4 sono riportati tutti i parametri necessari per ricavare la focale dell’obbiettivo da utilizzare con un dato sensore e definendo l’area da riprendere e la sua distanza dall’obbiettivo.

Fino a questo momento avevamo parlato di angolo di campo generico prendendo sempre come riferimento la dimensione diagonale del sensore di immagine.  Ma effettivamente il sensore è tipicamente rettangolare e quindi esistono due valori dell’angolo di campo: quello orizzontale e quello verticale ed in effetti l’angolo di campo non proietta sulla scena un cerchio ma un’ellisse.

Da questa considerazione (vd. figura sotto) si calcolano due valori focali: quello calcolato sulla larghezza dell’area che si vuole coprire  – fL – e quello che deriva dal valore dell’altezza dell’area da coprire – fH.  Difficilmente questi due valori coincideranno a meno che il rapporto tra L ed H del soggetto.

non coincidano con quello del sensore.

Il calcolo della focale - LUMI4INNOVATION

Ovviamente l’obiettivo non può avere due valori della focale per cui si dovrà fare una scelta di compromesso tra questi due valori e quelli standard disponibili.

Lunghezze focali fisse tipiche nella videosorveglianza sono di 3 – 4 mm nelle applicazioni in interno mentre sono tra 6 e 10 mm negli esterni. Una soluzione alternativa sono le “ottica varifocal” che, come suggerisce il nome stesso, sono caratterizzate da lunghezza focale variabile entro un certo intervallo. Le ottiche varifocali vengono spesso usate in quanto sono compatte come le ottiche a focale fissa e flessibili come le ottiche zoom. Ma, contrariamente allo zoom, il cambiamento della lunghezza focale fa perdere la focalizzazione che deve essere reimpostata.

 

La profondità di campo

In un sistema ottica-sensore esiste un solo piano, ortogonale all’asse ottico, che è perfettamente a fuoco, ovvero riprodotto perfettamente sul sensore e la cui immagine appare quindi nitida. Allontanandosi da questo piano la nitidezza dell’immagine si deteriora gradatamente.

La profondità di campo è quell’intervallo di distanze davanti e dietro al soggetto a fuoco in cui la sfocatura è impercettibile o comunque ancora tollerabile.

La profondità di campo dipende da vari fattori:

  • l’apertura dell’ottica (diaframma o iris)
  • la distanza di messa a fuoco
  • la lunghezza focale dell’obiettivo

Nel pensare alla telecamera da impiegare nel sistema vanno quindi prese in considerazione le influenze che questi parametri hanno sulla profondità.

Maggiore chiusura del diaframma corrisponde a maggiore profondità di campo mentre aprire il diaframma la diminuisce e aumenta la sfocatura davanti e dietro al soggetto a fuoco.

Più la messa a fuoco viene regolata per un soggetto lontano dall’obiettivo e più aumenta la profondità di campo così come si ha un miglioramento riducendo la lunghezza focale degli obiettivi.

Quindi se si desidera avere una ripresa migliore da questo punto di vista si debbono scegliere ottiche con lunghezza focale medio-bassa e riduzione dell’apertura del diaframma.

La risoluzione della videocamera di sorveglianza

Abbiamo già accennato a come il sensore di immagine sia una matrice di piccolissimi sensori di luce chiamati pixel e del fatto che esistano sensori in cui la quantità di pixel può variare da qualche centinaio di migliaia ad alcune decine di milioni.  È naturale pensare che più è elevato il numero di pixel e maggiore sarà la capacità del sensore di catturare i dettagli dell’immagine.

Più pixel la telecamera ha sul soggetto, più nitida sarà l’immagine.

La grandezza effettiva dell’immagine è indicata dalle due dimensioni – larghezza L ed altezza H – espresse in numero di pixel e il prodotto L´H è anche usato come definizione della risoluzione della telecamera. Nella figura sotto sono riportati, cercando di mantenere il rapporto dimensionale in pixel, alcuni dei formati utilizzati più frequentemente nelle applicazioni di videosorveglianza.

Formati tipici per sensori di immagine usati in applicazioni di videosorveglianza - LUMI4INNOVATION

Se supponiamo di avere due sistemi con la stessa lunghezza focale, la stessa distanza dal piano di fuoco e due sensori di uguali dimensioni ma uno con risoluzione di 3 MP (2.048 ´ 1.536)   e l’altro con risoluzione VGA (640 ´ 480) otterremo sì la stessa immagine ma nel primo la larghezza della scena sarà rappresentata da 2.048 pixel mentre nella seconda la stessa sarà coperta da 640 pixel.

Quanti pixel servono?

È una domanda importante perché è il punto cruciale di ogni impianto di videosorveglianza. L’istinto più comune è quello di cercare di semplificare il problema puntando alle telecamere con la massima risoluzione disponibile. Tuttavia, questo non è il modo migliore per usare delle risorse. Spesso due telecamere da 1,3 megapixel nel posto giusto sono più utili e più efficaci di una da 3 megapixel.

In altre parole, non si tratta solo di quanti megapixel è dotata la telecamera ma di quello che chiediamo a quei pixel di fare.

Non importa quanto sia alta o bassa la risoluzione della telecamera ma è un fatto che è più efficace quando il soggetto è più vicino alla telecamera e meno efficace quando è più lontano. Possiamo quindi immaginare di dividere il campo di messa a fuoco in tre zone di efficacia normalmente definite di rilevamento, di classificazione e di identificazione.

  1. Rilevamento

Quando il soggetto entra nell’inquadratura l’osservatore può dire che c’è qualcosa, una persona, un veicolo o un animale ma non ci sono dettagli sufficienti per definirlo più precisamente. Siamo al livello del rilevamento.

  1. Classificazione

Quando il soggetto si avvicina alla telecamera possiamo vedere dettagli sufficienti per distinguerlo da altri soggetti simili. Siamo in grado di dire la differenza tra un furgone e un camion, o tra una persona che indossa una giacca o una felpa con cappuccio. Siamo al livello di classificazione.

  1. Identificazione

Quando il soggetto è molto vicino alla telecamera si vedono dettagli sufficienti per identificarlo definitivamente e sicuramente, siamo al livello della identificazione. Sono visibili dettagli sufficienti per identificare con certezza un soggetto, identificazione valida eventualmente anche a livello forense.

Possiamo quindi tradurre la domanda di apertura in una più precisa: “Quanti pixel per metro (PPM) sono necessari?

Le raccomandazioni sono diverse, ma la maggior parte degli esperti concordano sul fatto che ci vogliono – in pieno giorno – circa 190 PPM per l’identificazione, 130 PPM per la classificazione e 70 PPM per il rilevamento. Valori che crescono durante la visione notturna a 260/290 per l’identificazione, a circa 190 per la classificazione e a 130 per il rilevamento.

Esempio di campo visivo - risoluzione ottenibile - LUMI4INNOVATION

Scritto da
Franco Musiari