logo simone provenzano

 

Dott. Simone Provenzano - Tecniche di analisi di immagine applicate allo studio dei suoli

Tesi di Laurea Magistrale in Scienze Geologiche - Capitolo II - Cenni teorici sull'analisi di immagine - Unical

 

 

 

 

 

L'esistenza di una eventuale correlazione lineare fra le variabili può essere studiata graficamente rappresentando le coppie di valori come punti su un diagramma binario detto diagramma a dispersione (in inglese scatter plot). Generalmente si rappresenta sull'asse y la variabile dipendente e sull'asse x la variabile indipendente. Se non esistono una variabile dipendente ed una indipendente (ad esempio due serie di misure di uno stesso parametro effettuate attraverso due strumenti diversi) ciascuna variabile può essere rappresentata su uno qualunque dei due assi. La relazione fra le variabili può essere studiata attraverso una curva di regressione lineare. Tale curva (di seguito indicata come retta di regressione) rappresenta la retta che meglio approssima l'andamento complessivo della serie di punti, e la sua forma generica è espressa nell'equazione (2.8):

 

 

equazione retta           (2.8)

 

 

in cui b è il coefficiente angolare (indicativo della pendenza) della retta, mentre a è l'intercetta, cioè il punto in cui la retta intercetta l'asse delle y; in termini matematici l'intercetta è il valore che assume y quando si pone x=0. Per ricavare i valori dei parametri a e b si ricorre al metodo dei minimi quadrati; questo metodo consiste nella ricerca dei parametri a e b tali per cui si ottenga la minima somma dei quadrati delle distanze (εi) dei valori (y) osservati dalla retta di regressione (Fig. 2.35).

 

 

errori retta regressione approssimazione

Fig. 2.35. Esempio di distanze (εi) di una serie di punti dalla retta di regressione.

 

 

In altre parole si assume che la relazione sia lineare, ma che ci siano degli errori di misura (εi) che fanno sì che uno o più punti non giacciano sulla stessa retta. Si utilizzano i valori al quadrato per evitare che errori positivi e negativi si compensino a vicenda.

 

 

 

 

 

Per applicare matematicamente il metodo dei minimi quadrati si dovrà quindi porre:

 

 

metodo dei minimi quadrati           (2.9)

 

 

Per rispettare la condizione di minimo bisogna porre uguali a zero le derivate della (2.9) rispetto ai parametri incogniti a e b. Sviluppando i calcoli si ottengono i seguenti risultati:

 

 

coefficiente b retta di regressione           (2.10)

 

 

coefficiente a retta di regressione           (2.11)

 

 

Calcolati i valori numerici di a e b è possibile ottenere l'equazione della retta di regressione, e di conseguenza è possibile anche rappresentarla su un diagramma (Fig. 2.36):

 

 

equazione retta di regressione punti coordinate

Fig. 2.36. Esempio di una serie di punti e relativa retta di regressione.

 

 

 

 

 

Se c'è una relazione fra le due variabili, l'equazione della retta di regressione può essere utilizzata per prevedere il valore di una variabile al variare dell'altra. Va precisato che tale operazione può essere eseguita solo all'interno dell'intervallo dei valori campione. Non è possibile estrapolare poiché, se per ipotesi si avessero dei dati campione anche oltre questo intervallo, molto probabilmente la curva di regressione avrebbe un andamento diverso e quindi anche un'equazione diversa.
Se si sostituisce il valore di a nell'equazione (2.8) si ottiene:

 

 

equazione regressione          (2.12)

 

 

Una particolarità è che se si pone "x=xm" si ottiene "y=ym" ; ciò indica che la retta contiene il punto di coordinate (xm;ym), che si può immaginare come il centro di gravità dei dati.
Un modo per ottenere una valutazione grafica circa l'attendibilità della funzione di regressione determinata si basa sulle cosiddette bande di confidenza. Le bande di confidenza (curve verdi tratteggiate in Fig. 2.37) rappresentano i confini di tutte le possibili rette di regressione con una confidenza del 95%. Più nello specifico, le bande di confidenza delimitano un'area, detta intervallo di confidenza, tale per cui si ha il 95% di probabilità che la retta di regressione reale si trovi al suo interno. L'intervallo di confidenza è quindi relativo alla retta di regressione e non ai punti campione, che possono anche trovarsi fuori da tale intervallo. Più stretto è l'intervallo di confidenza, migliore sarà l'attendibilità della funzione di regressione determinata.

 

 

scatter plot retta regressione intervallo confidenza

Fig. 2.37. Esempio generico di scatter plot contenente: diversi punti campione (blu); la retta di regressione (rossa) che meglio ne approssima l'andamento; le bande di confidenza (verdi tratteggiate) che delimitano un intervallo di confidenza del 95% relativo a tutte le possibili rette di regressione; alcune possibili rette di regressione (grigie).

 

 

In Fig. 2.37 sono rappresentate quattro possibili rette di regressione (colore grigio) oltre a quella reale (colore rosso) determinata per i punti campione. In particolare, le due rette con pendenza minima e massima sono tangenti alle bande di confidenza in corrispondenza dei valori di ascisse relativi ai valori minimo e massimo dei dati campione. Come è possibile osservare, tutte le rette di regressione passano per uno stesso punto (colore nero); tale punto corrisponde al valore medio (xm;ym) dei dati campione (colore blu). Man mano che ci si avvicina al punto medio, l'intervallo di confidenza si restringe poiché tutte le rette sono presenti in un'area sempre più piccola. Man mano che ci si allontana dal punto medio invece le rette divergono e di conseguenza l'area di interesse aumenta. A livello matematico, l'intervallo di confidenza combina gli intervalli di confidenza del coefficiente angolare (parametro b), e dell'intercetta (parametro a). È per questo che graficamente si ottengono più rette di regressione con diverse pendenze.

 

 

indice 1 2 3 4 5 6 7 8 9 10 11 12 13 14 bibliografia

 

unical

È possibile utilizzare liberamente le immagini ed i contenuti del presente capitolo di tesi, purché si inseriscano gli opportuni riferimenti bibliografici. Si consiglia un modello di citazione come quello espresso di seguito per tutte le immagini ed i contenuti ove, nel presente capitolo, non siano già presenti espliciti riferimenti bibliografici:

Provenzano Simone. Tecniche di Analisi di immagine applicate allo studio dei suoli (155 pagg.). Tesi di Laurea Magistrale in Scienze Geologiche. Unical - Università della Calabria. A.A. 2014/2015. Relatori: Scarciglia Fabio, Miriello Domenico. Pagg. 26-73.

 

 

 

 

Privacy e Cookie