logo simone provenzano

 

Dott. Simone Provenzano - Tecniche di analisi di immagine applicate allo studio dei suoli

Tesi di Laurea Magistrale in Scienze Geologiche - Capitolo II - Cenni teorici sull'analisi di immagine - Unical

 

 

 

 

 

Per comprendere meglio questi concetti è possibile osservare gli esempi riportati in Fig. 2.3. Immaginiamo di avere a che fare con un'immagine di 3x1 pixel in cui i valori dei pixel siano, in ordine, 3, 4 e 5 (Fig. 2.3a). Immaginiamo poi di applicare una riduzione di risoluzione tale per cui si ottenga una nuova immagine di 2x1 pixel in cui vada perso il pixel centrale (Fig. 2.3b). Se aumentiamo nuovamente la risoluzione dell'immagine in modo da riottenere un'immagine di 3x1 pixel, verrà creato un nuovo pixel intermedio che avrà come valore la media dei valori noti dei pixel adiacenti, cioè 4. La nuova immagine ottenuta (Fig. 2.3c) in questo caso sarà uguale a quella originaria. Siamo stati fortunati perché il pixel centrale aveva proprio il valore medio dei valori dei pixel adiacenti, ma nei casi reali questa circostanza è molto rara. Si ha a che fare piuttosto con situazioni nelle quali i pixel possono presentare valori anche molto discostanti rispetto ai valori dei pixel adiacenti. Consideriamo ad esempio il caso riportato in Fig. 2.3d: questa volta il pixel centrale ha un valore pari a 9. Ripetendo i processi di riduzione della risoluzione (Fig. 2.3e) e nuovo aumento della risoluzione (Fig. 2.3f) non si ottiene più un'immagine uguale a quella originaria.

 

 

ridimensionamento resize immagini

Fig. 2.3. Esempi sulla possibile perdita di informazioni provocata da variazioni della risoluzione in un'immagine digitale. Si osservino le due sequenze di processi a-b-c e d-e-f. a: immagine originale (caso 1); b: riduzione della risoluzione; c: nuovo aumento della risoluzione; d: immagine originale (caso 2); e:riduzione della risoluzione; f: nuovo aumento della risoluzione.

 

 

Di conseguenza è possibile comprendere che non è conveniente aumentare la risoluzione in un'immagine digitale, per due motivi principali: 1) le informazioni perse non possono essere recuperate; 2) la nuova immagine ottenuta occupa maggiore spazio sul supporto di memorizzazione poiché contiene nuove informazioni, le quali peraltro sono errate.
Va precisato che il solo valore della risoluzione non basta per esprimere in modo assoluto il livello di dettaglio di un'immagine digitale, poiché tutto dipende fortemente dalle dimensioni reali degli elementi di interesse all'interno dell'immagine stessa. Ad esempio, una risoluzione di 300 dpi può essere sufficiente a rappresentare il viso di una persona, ma non è più sufficiente se si vogliono osservare le cellule che ne costituiscono la pelle. Per questi motivi spesso la risoluzione viene trattata in funzione del più piccolo elemento reale che può essere riconosciuto.
Un altro parametro importante nelle immagini digitali riguarda la loro fedeltà in termini di colore, che viene espressa attraverso il parametro della profondità di colore.

 

 

 

 

 

Il numero di colori minimo con cui può essere rappresentata un'immagine è 2, che generalmente corrispondono al bianco ed al nero. In questo caso si parla di immagine binaria (Fig. 2.4a), che a livello informatico può essere codificata e rappresentata attraverso un singolo bit per pixel (assegnando il valore 1 al nero ed il valore 0 al bianco, o viceversa). Si tratta di immagini con scarsa fedeltà in quanto non contengono sfumature intermedie. Ciononostante le immagini binarie sono molto trattate nell'analisi di immagine poiché vengono utilizzate per rappresentare le superfici ricoperte dagli oggetti di interesse all'interno dell'immagine digitale (questo argomento verrà approfondito in seguito).
Se si introducono anche le sfumature intermedie si ottiene un'immagine in scala di grigi (Fig. 2.4b). Generalmente si utilizzano 256 livelli di grigio, con il valore 0 per il nero, i valori da 1 a 254 per i livelli intermedi, ed il valore 255 per il bianco. Dal momento che ogni bit è costituito da due valori (0 e 1), per codificare 256 valori sono necessari 8 bit (28=256).
Per quanto riguarda le immagini a colori (Fig. 2.4c), queste generalmente si basano sul modello RGB, acronimo dei tre colori primari sui quali tale modello si basa, cioè Red (rosso), Green (verde) e Blue (blu). Le immagini RGB fanno uso di 256 livelli per ciascun colore, arrivando in totale a 2563 combinazioni possibili, cioè circa 16 milioni di tonalità di colore, per codificare le quali sono necessari 24 bit (224=16.777.216).

 

 

immagine binaria scala grigi rgb

Fig. 2.4. Tipologie di profondità di colore. a: immagine binaria; b: immagine in scala di grigi; c: immagine in RGB.

 

 

 

 

 

Il modello RGB è di tipo additivo, cioè si basa su un principio secondo il quale, se si osserva un fascio luminoso derivante dalla sovrapposizione di un fascio rosso, un fascio verde ed un fascio blu tutti con la massima intensità (cioè a livello informatico pari a 255), l'occhio umano vedrà come risultato una luce bianca. Se invece tutti i fasci di luce hanno la minima intensità (cioè pari a 0), l'occhio umano non vede nulla, cioè vede il nero. La combinazione dei colori RGB a due a due produce invece i colori primari ciano, giallo e magenta. Il funzionamento del modello RGB viene mostrato schematicamente in Fig. 2.5.

 

 

modello RGB

Fig. 2.5. Rappresentazione schematica del modello RGB.

 

 

Come le immagini digitali, anche i comuni display elettronici a colori (televisori, schermi di computer, di telefoni cellulari, ecc.) sono costituiti da una matrice di pixel, e la rappresentazione dei diversi colori si basa proprio sul modello RGB. In particolare ciascun pixel è costituito da tre microscopiche unità luminose, che si occupano di emettere una luce rispettivamente rossa, verde e blu (Fig. 2.6) con intensità variabile da 0 a 255. Il colore che ciascun pixel assume per l'occhio umano deriva dalle diverse combinazioni di colore delle tre unità luminose, secondo le modalità precedentemente descritte.
Quando un'immagine digitale viene stampata, sul supporto di stampa vengono impressi più punti di diversi colori le cui combinazioni producono il colore risultante (Fig. 2.7)
In questo caso si preferisce utilizzare un modello di colori diverso. Si tratta del modello CYMK (Fig. 2.8), acronimo dei colori primari Cyan (ciano), Yellow (giallo) e Magenta (magenta), con l'aggiunta del Key (nero). Nel caso delle immagini in CYMK, ciascun colore può assumere valori da 0 a 100.

 

 

pixel RGB display monitor

Fig. 2.6. Struttura a matrice di pixel nei comuni display elettronici a colori.

 

 

artefatti stampa immagini

Fig. 2.7. Immagine stampata nella pagina di una rivista. a: immagine per come appare all'occhio umano. b: particolare ingrandito dell'immagine che mette in evidenza i punti di inchiostro che la costituiscono. N.B. In genere le immagini stampate contengono anche degli artefatti dovuti alla trama ed al materiale del supporto di stampa.

 

 

modello CYMK

Fig. 2.8. Rappresentazione schematica del modello CYMK.

 

 

Se si combinano i colori primari a due a due si ottengono i colori blu (ciano + magenta), verde (ciano + giallo) e rosso (magenta + giallo). Se non si utilizza nessun colore si ottiene il colore bianco, poiché ciò corrisponde ad una stampa vuota su un foglio bianco. Se si utilizzano insieme tutti i tre colori primari si ottiene il nero. Bianco e nero vengono ottenuti quindi in modo inverso rispetto al modello RGB. Questo accade perché, a differenza del modello RGB, il modello CYMK è di tipo sottrattivo, cioè si basa sulla capacità dei pigmenti di assorbire la luce piuttosto che di emetterla. In particolare, quando la luce naturale (bianca) colpisce i pigmenti, una parte del suo spettro viene assorbita ed un'altra parte viene riflessa. L'occhio umano vedrà come colore risultante le componenti dello spettro che vengono riflesse. Si parla di modello sottrattivo perché in teoria, se si combinano insieme i tre colori primari puri (cioè tutti con valore 100), si produce un assorbimento completo della luce, che appare quindi come un colore nero. Nella realtà però è stato osservato che questa combinazione non produce un colore perfettamente nero. Per questo motivo i dispositivi di stampa sono dotati, oltre che degli inchiostri relativi ai tre colori primari, anche dell'inchiostro nero. Per comprendere meglio questo concetto sono stati messi a confronto e rappresentati in Fig. 2.9 i diversi tipi di nero che si possono ottenere attraverso il modello CYMK. Se si combinano i tre colori primari insieme al nero si ottiene il risultato mostrato in Fig. 2.9a. Se si combinano solo i tre colori primari senza il nero si ottiene il risultato mostrato in Fig. 2.9b, che apparentemente potrebbe sembrare anch'esso nero. Se però si sovrappongono i due risultati ottenuti (Fig. 2.9c) si può notare che i due colori non sono uguali. In particolare, se si combinano solo i tre colori primari senza aggiungere il nero, si ottiene un colore molto vicino al nero, ma non completamente nero (una sorta di grigio molto scuro). Esiste infine un altro tipo di nero, che può essere ottenuto utilizzando il solo pigmento nero senza ricorrere ai tre colori primari. In questo caso si ottiene un colore più vicino al nero completo, ma ancora non perfettamente nero (barretta obliqua in Fig. 2.9d).

 

 

diversi tipi di nero in immagini CYMK

Fig. 2.9. Differenze fra diversi tipi di nero in un'immagine CYMK. a: nero perfetto, ottenuto utilizzando il valore 100 per i tre colori primari, più il valore 100 anche per il nero. b: nero non perfetto, ottenuto utilizzando il valore 100 per i tre colori primari ed il valore 0 per il nero. c: sovrapposizione dei due tipi di nero per facilitare il confronto. d: sovrapposizione di un altro tipo di nero (barretta obliqua) ottenuto utilizzando il valore 0 per i tre colori primari ed il valore 100 per il nero.

 

 

Resta da approfondire quali sono i vantaggi e gli svantaggi dei due modelli di colore descritti, in modo da comprendere meglio perché non si utilizza un solo modello di colore per tutti gli ambiti. Per quanto riguarda le immagini in RGB, la scelta dei relativi colori primari dipende dalle caratteristiche dell'occhio umano. Considerando lo spettro luminoso, l'occhio umano reagisce meglio alle lunghezze d'onda relative alla luce rossa, verde e blu. Le differenze di segnali ricevuti in queste tre lunghezze d'onda consentono al cervello umano di riconoscere un'ampia gamma di tonalità diverse, più ampia rispetto a quelle riproducibili dalle immagini in CYMK. Ciò accade sostanzialmente perché il modello RGB si basa sull'emissione diretta della luce, mentre il modello CYMK si basa sul rapporto fra luce assorbita e luce riflessa. In altri termini, le immagini in RGB possono mostrare un maggior numero di tonalità di colore, e generalmente appaiono più accese rispetto alle immagini in CYMK. Per questo motivo, quando un'immagine deve solo essere visualizzata su schermo e non stampata, si preferisce utilizzare il modello RGB. Di contro, se si stampa un'immagine in RGB non si ottiene un risultato in RGB poiché un foglio stampato è intrinsecamente un supporto che si comporta secondo il modello CYMK. Il limite del modello CYMK rispetto al modello RGB diventa però un vantaggio quando si lavora su immagini da destinare alla stampa, poiché consente di visualizzare sul monitor i colori così come verranno stampati.

 

 

indice 1 2 3 4 5 6 7 8 9 10 11 12 13 14 bibliografia

 

unical

È possibile utilizzare liberamente le immagini ed i contenuti del presente capitolo di tesi, purché si inseriscano gli opportuni riferimenti bibliografici. Si consiglia un modello di citazione come quello espresso di seguito per tutte le immagini ed i contenuti ove, nel presente capitolo, non siano già presenti espliciti riferimenti bibliografici:

Provenzano Simone. Tecniche di Analisi di immagine applicate allo studio dei suoli (155 pagg.). Tesi di Laurea Magistrale in Scienze Geologiche. Unical - Università della Calabria. A.A. 2014/2015. Relatori: Scarciglia Fabio, Miriello Domenico. Pagg. 26-73.

 

 

 

 

Privacy e Cookie