geostatistica, statistica spaziale, Donald E. Myers

CHE COS'È LA GEOSTATISTICA?


Questo sito è gestito da Donald E. Myers


Non è necessario essere uno statistico per fare buon uso della geostatistica, ma potrebbe esserti necessaria l'assistenza, il supporto, la guida di uno (geo?)statistico. Un buon ingegnere, ecologo, biologo, scienziato vegetale, idrologo, fisico del suolo hanno già un buon inizio, perché la geostatistica è solo una buona scienza aggiornata grazie al riconoscimento che i fenomeni naturali sono soggetti a variazioni spaziali. Il tuo studio della geostatistica non sostituirà le altre conoscenze che hai; piuttosto, le estenderà e le renderà più utili.

(parafrasato da una citazione di William Edwards Deming)



UN PO 'DI STORIA

L'applicazione delle statistiche ai problemi di geologia, estrazione mineraria e idrologia risale ad un lasso di tempo considerevole. Per un certo periodo, la geostatistica ha significato statistiche applicate alla geologia o forse più in generale ai problemi nelle Scienze della Terra. A partire dalla metà degli anni '60, e in particolare verso la metà degli anni '70, divenne molto più strettamente legato al lavoro di Georges Matheron e forse quella connessione prevale ancora oggi. Poiché gran parte dei suoi primi lavori e anche quello dei suoi studenti apparivano principalmente in francese, non era molto conosciuto negli Stati Uniti e in altri paesi. Diversi eventi iniziarono a cambiare questo, comunque. Nel 1975 un NATO ASI si tenne vicino a Roma, in Italia, sulla geostatistica avanzata nell'industria mineraria. Il procedimento conteneva documenti che erano principalmente in inglese. Questo era stato preceduto da una serie di note (di Matheron) preparate per un programma estivo a Fontainebleau. Queste note erano in inglese ma non facilmente disponibili. Un articolo teorico più definitivo apparve nella J. Applied Probability del 1973.

Il professor Matheron era all'Ecole Normale Superieure des Mines de Paris (Scuola delle Miniere), una delle Grandi Ecoles. Come parte di una mossa generale di unità di ricerca fuori dalla sede principale di Parigi (adiacente al Jardin du Luxembourg), Matheron ha fondato il Centre de Morphologie Mathematique. Più tardi divennero due programmi, uno sulla morfologia matematica e sulla geostatistica. Matheron è andato in pensione come direttore del Centro, ma solo l'ultimo anno. La serie di due volumi di Jean Serra sulla morfologia matematica e l'analisi delle immagini è ben nota e si basa sul precedente libro di Matheron sulla teoria degli insiemi casuali. Due studenti di Matheron sono stati determinanti nell'impiantare la geostatistica in Nord America. Andre Journel si è trasferito alla Stanford University nel 1978 ed è stato anche coautore di Mining Geostatistics con Ch. Huijbrechts. Michel David si era precedentemente trasferito all'Ecole Polytechnique di Montreal e nel 1977 ha pubblicato la Stima della riserva minerale geostatistica. Journel era nel Dipartimento di Scienze Applicate della Terra, ma più recentemente quel dipartimento è stato chiuso ed è ora nel Dipartimento di Ingegneria del Petrolio e ha istituito (con l'aiuto di varie compagnie petrolifere) lo Stanford Center per la Previsione dei Bacini Idrici.
Il lavoro di Matheron non è stato ben accetto nella comunità statistica per un certo periodo di tempo, anche se un certo numero di eminenti statistici sono stati visitatori di Fountainebleau negli anni '70, '80 e '90. In parte ciò era dovuto alla sensazione che parte del lavoro fosse una duplicazione di risultati che erano già noti ma con nomi diversi. Probabilmente la propensione di Matheron a pubblicare solo in francese e solo nelle "note interne" del Centro ha contribuito a questa percezione. Ora, tuttavia, la geostatistica ha stabilito un posto per sé sia all'interno delle riviste di statistica che negli incontri nazionali. A metà degli anni '80, con l'aiuto di M. Armstrong, un indice di quelle note fu pubblicato in Geologia Matematica, ma anche se era possibile ordinare copie dal Centro, non c'era un deposito generalmente accessibile al di fuori di esso. L'indice sopra riportato è ormai superato. Sempre con l'assistenza di M. Armstrong, un piccolo numero di queste note è apparso come articoli di giornale. GLOSSARIO

Software

Alla fine degli anni '70 il Centre de Geostatistique, Fountainebleau, iniziò un programma di livello master in geostatistica (due anni) che attirò un flusso costante di studenti dell'industria e del governo in vari paesi. In collaborazione con Shell Oil e Bureau de Recherche Geologie Mathematique (l'USGS francese), è stato sviluppato un pacchetto software commerciale chiamato BLUEPACK. La versione precedente era stata trasferita al VAX, ma il successore, ISATIS, è disponibile su un numero di piattaforme di workstation. È commercializzato negli Stati Uniti da GEOMATH di Houston. La geostatistica senza computer è di scarso interesse, in molti modi gli sviluppi della geostatistica sono paralleli a quelli dell'informatica, in particolare l'aspetto di PC e workstation.


Pubblicazioni e Conferenze

Due piccoli volumi sulla geostatistica incentrati sull'estrazione mineraria sono apparsi in inglese negli anni '70, uno di Jean-Michel Rendu e uno di Isabel Clark. Alla fine degli anni '80 apparve il volume di Isaaks e Srivastava, successivamente un libro di Noel Cressie (sul tema più generale delle statistiche spaziali ma includendo la geostatistica).

Nell'estate del 1983 una seconda ASI della NATO si tenne a Lake Tahoe, NV con un mix più internazionale e includendo ricercatori provenienti da un più ampio insieme di applicazioni. Grazie a una serie di quattro articoli di Richard Webster e alcuni dei suoi studenti (poi al Rothamstead Research Centre in Inghilterra), la geostatistica divenne nota nelle Scienze del Suolo. Questi sono apparsi su J. Soil Science (1980-1981). Nel 1979 a Praga fu fondata l'Associazione Internazionale dei Geologi Matematici e in seguito iniziò a pubblicare la J. of the Int. Assn. Math. Geologists (in seguito il nome fu ufficialmente cambiato in semplice Geologia Matematica). Mentre la rivista non si limitava alla geostatistica, divenne rapidamente il luogo principale in cui pubblicare tali documenti. Un terzo congresso internazionale di geostatistica si è tenuto ad Avignone, in Francia nel 1988, un quarto a Troia, in Portogallo nel 1992 e il più recente a Wollongong, in Australia nel 1996. Dopo la conferenza del 1983, Andre Journel e Leon Borgman (Università del Wyoming) hanno proposto un ritiro estivo annuale in geostatistica rivolto ai ricercatori del Nord America. Il primo si è tenuto vicino a DuBois, nel Wyoming, nell'agosto del 1984. Il gruppo era piccolo e le famiglie sono state incoraggiate, le sessioni sono state informali e non è stato presentato alcun procedimento, ma successivamente è stata avviata una newsletter che da allora non è più apparsa. Una non-organizzazione è stata fondata nel 1987 in un incontro nei Mt. Chirachaua a sud-est di Tucson, non c'erano quote, nessuna lista di iscrizione, nessun prezzo di abbonamento per la newsletter, ma i volontari venivano sollecitati ogni anno per organizzare riunioni. Molti si sono tenuti in Canada e negli Stati Uniti e nel 1996 si è tenuto un incontro a Guanajuato, in MX. In seguito alla creazione della newsletter in Nord America, è stata creata un'altra newsletter destinata alla Comunità Europea.

In seguito all'incontro del 1983 diversi membri dello staff dell'EPA di Las Vegas si interessarono all'applicazione della geostatistica al monitoraggio e alla valutazione ambientale. Oltre al supporto di ricerca per un numero di individui e programmi, l'EPA ha commissionato un pacchetto software geostatistico, GEO-EAS, che è stato poi rilasciato nel pubblico dominio. GEO-EAS era un programma DOS ma includeva un sistema di menu che lo rendeva abbastanza amichevole e il prezzo era giusto. Sfortunatamente, per vari motivi, EPA non ha continuato a supportare il software e non è stato aggiornato per un certo numero di anni. Nel 1992 Andre Journel e Clayton Deutsch pubblicarono GSLIB che includeva un floppy disk. Si trattava di una vasta serie di programmi geostatistici (codice sorgente FORTRAN) e un manuale per gli utenti. Le versioni attuali del codice sono disponibili sul sito Web di Stanford. Sfortunatamente i programmi non includevano alcuna forma di GUI e sono progettati per essere eseguiti in modalità batch. Sono comunque compilabili su una varietà di piattaforme. Nel 1996 Yvan Pannatier ha pubblicato VARIOWIN insieme a un floppy disk. VARIOWIN è una versione MS-Windows di due componenti di GEO-EAS. Permette set di dati molto più ampi rispetto a GEO-EAS e anche la modellazione di variogrammi interattivi.


Geostatistica all'Università dell'Arizona

La geostatistica è stata insegnata all'Università dell'Arizona dall'autunno del 1982, tuttavia il lavoro di collaborazione è iniziato molto prima tra Y.C. Kim e Donald Myers, A. W. Warrick (Scienze del suolo, dell'acqua e dell'ambiente) e Donald Myers. I corsi attirarono rapidamente studenti da vari dipartimenti; Ingegneria mineraria, Idrologia, Scienze del suolo, dell'acqua e dell'ambiente. Più recentemente studenti di Remote Sensing, Plant Pathology, Geography, Tree-Ring Lab, Renewable Natural Resources ne sono stati attratti. Questa è una conseguenza diretta della natura quantitativa della ricerca in questi vari programmi.

Altri Sviluppi

C'erano altri tre sviluppi che non dovrebbero essere trascurati. B. Matern, lavorando in Svezia, sviluppò essenzialmente una teoria parallela a Matheron, ma con applicazioni principalmente in silvicoltura. La sua opera è apparsa in svedese nel 1960 e non è stata tradotta in inglese fino al 1986 (Springer-Verlag). Y. Ghandin, che lavorava nell'ex Unione Sovietica, ha applicato il suo lavoro principalmente alla meteorologia e alle scienze atmosferiche, dove era noto come Objective Analysis. Questo lavoro non è apparso in inglese fino a molto tempo dopo, quando è emigrato in Israele. Finalmente nel 1971, R. Hardy (Iowa State University), lavorando su problemi relativi all'interpolazione dei dati gravitazionali, sviluppò quelle che divennero note come Funzioni di Base Radiale. Il suo lavoro è molto più conosciuto nella letteratura sull'analisi numerica.




Applicazioni

La geostatistica è una disciplina applicata (o forse non è nemmeno una disciplina), il suo sviluppo è stato il lavoro di ingegneri minerari, ingegneri petroliferi, idrologi, scienziati del suolo, geologi e statistici. Esistono applicazioni in epidemiologia, patologia vegetale o entomologia nonché in silvicoltura, scienze atmosferiche, cambiamenti globali, geografia. C'è una certa sovrapposizione con GIS (Geographic Information Systems) e statistiche spaziali in generale. In particolare, dovrebbero essere segnalate altre due riviste, Water Resources Research e J. Soil Science Society of America. Più recentemente sono apparsi articoli su Environmetrics, Remote Sensing of the Environment e molti altri, troppo numerosi da menzionare.

Come notato sopra, l'idrologia era una delle prime applicazioni, l'attività in tre luoghi dovrebbe essere notata; Il gruppo di L. Gelhar al MIT (che ha collegamenti con New Mexico Tech a Socorro), il gruppo Hydrology a Fontainebleau (in particolare G. DeMarsily che è ora all'University Paris-Jussieu) e, naturalmente, il Dipartimento di Idrologia all'Università dell'Arizona.

PROBLEMI E OBIETTIVI

Da un punto di vista, la geostatistica potrebbe essere vista semplicemente come una metodologia per interpolare dati su un modello irregolare, ma questo è troppo semplicistico. Un certo numero di metodi di interpolazione/ algoritmi erano già noti quando la geostatistica cominciò a essere conosciuta. La “Inverse Distance Weighting” e la “Trend Surface Analysis”, così come il molto più semplice algoritmo “Nearest Neighbor“.

Innanzitutto, la geostatistica riguarda i dati spaziali. Cioè, ogni valore di dati è associato a una posizione nello spazio e vi è almeno una connessione implicita tra la posizione e il valore dei dati. "Posizione" ha almeno due significati; uno è semplicemente un punto nello spazio (che esiste solo in un senso matematico astratto) e in secondo luogo un'area o un volume nello spazio. Ad esempio, un valore di dati associato a un'area potrebbe essere il valore medio di una variabile osservata, mediata su quel volume. In quest'ultimo caso, l'area o il volume viene spesso chiamato il "supporto" dei dati. Questo è strettamente correlato all'idea del supporto di una misura. Sia x, y, ..., w siano punti (non solo coordinate) in 1, 2 o 3 spazi dimensionali e Z(x), Z(y), ... denotano valori osservati in queste posizioni. Ad esempio, questo potrebbe essere il grado del rame, la temperatura, la conduttività idraulica, la concentrazione di un inquinante. Supponiamo ora che t sia un luogo che non è "campionato". L'obiettivo è quindi di stimare/prevedere il valore Z(t) (e le posizioni dei dati, nonché la posizione t). Se viene fornita solo questa informazione, il problema è mal posto, cioè non ha una soluzione unica. Un modo per ottenere una soluzione unica è introdurre un modello nel problema. Ci sono due modi per farlo; uno è deterministico e il secondo è stocastico o statistico. Entrambi gli approcci devono in qualche modo incorporare l'idea che esista un'incertezza associata alla fase di stima/previsione. Il valore nella posizione non campionata non è casuale ma la nostra conoscenza di esso è incerta. Un approccio quindi è trattare Z(x), Z(y), .... e Z(t) come valori di variabili casuali. Se la distribuzione congiunta di queste variabili casuali fosse nota, allora lo stimatore "migliore" (migliore significa imparziale e con la minima variazione dell'errore di stima) sarebbe l'aspettativa condizionata di Z(t) dati i valori delle altre variabili casuali. Tuttavia i dati consistono in una sola osservazione delle variabili casuali Z(x), Z(y), .... e nessuna della variabile casuale Z(t), quindi non è possibile stimare o modellare questa distribuzione usando metodi standard di modellizzazione o adattamento delle distribuzioni di probabilità.