Geoestatística Básica e Aplicada

Geoestatística Básica e Aplicada

(Parte 1 de 9)

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 1

Fevereiro - 2004 Uberlândia - MG

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 1

1. INTRODUÇÃO2
2. ANÁLISE EXPLORATÓRIA DE DADOS3
2.1. Distribuição de freqüências e histograma3
2.2. As estatísticas3
2.3. Outras análises descritivas7
2.4. Amostragem7
2.5. Exemplos de análise exploratória aplicando o programa GS+8
3. PRINCÍPIOS DA ANÁLISE GEOESTATÍSTICA14
3.1. Um breve histórico14
3.2. Estacionaridade15
3.3. Krigagem universal20
4. ANÁLISE DA DEPENDÊNCIA ESPACIAL21
4.1. Autocorrelação e Autocorrelograma21
4.2. Semivariograma25
4.3. O uso do software GS+ na determinação do semivariograma36
4.4. Exemplos de aplicação41
5. KRIGAGEM50
5.1. O interpolador50
5.2. A krigagem no programa GS+52
6. SEMIVARIOGRAMA CRUZADO E COKRIGAGEM5
6.1. Semivariograma cruzado5
6.2. Co-krigagem56
6.3. Variância da estimativa60
6.4. Número de vizinhos das estimativas62
da co-krigagem e no mapeamento da variável

SUMÁRIO 6.5. O uso do programa GS+ na determinação do semivariograma cruzado, 64

6.6. Exemplos de aplicação no GS+67
7. VALIDAÇÃO DE MODELOS DE SEMIVARIOGRAMAS70

8. BIBLIOGRAFIA RECOMENDADA.......................................................... ............... 74

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 2

1. INTRODUÇÃO

Métodos clássicos de análise estatística de dados geralmente supõem que, as realizações das variáveis aleatórias são independentes entre si, ou seja, que observações vizinhas não exercem influências umas sobre as outras.

Fenômenos naturais apresentam-se freqüentemente com uma certa estruturação nas variações entre vizinhos, desta forma pode-se dizer que as variações não são aleatórias e, portanto, apresentam algum grau de dependência espacial.

A análise espacial de dados apresenta-se como uma alternativa e/ou como uma complementação da análise clássica de dados, sendo que este tipo de análise considera as correlações entre as observações quando se faz estimativas.

A literatura apresenta alguns procedimentos de análise espacial de dados, sendo que, nos últimos tempos, uma metodologia de análise denominada “geoestatística” ganhou ênfase neste tipo de estudo.

Neste trabalho serão abordados aspectos básicos da metodologia geoestatística para a análise espacial de dados, com ênfase na análise do semivariograma como ferramenta de determinação da dependência espacial.

Inicialmente serão abordados aspectos básicos de uma análise exploratória de dados; em seguida serão introduzidos conceitos básicos da geoestatística e da análise da dependência espacial por meio de semivariograma e também de interpolação utilizando a metodologia da krigagem e, por fim serão abordados conceitos básicos de semivariogramas cruzados e co-krigagem. Sempre que possível os tópicos serão acompanhados de exemplos de aplicação.

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 3

2. A ANÁLISE EXPLORATÓRIA DE DADOS

A análise exploratória de dados é um procedimento de grande importância na análise estatística e aplica-se para qualquer metodologia que se queira utilizar. Nesta análise preliminar dos dados tem-se o objetivo de conhecer a variável em estudo e resumila. Basicamente, este tipo de análise se baseia em construção e interpretação gráfica e cálculos e interpretação de estatísticas.

No presente texto faremos uma revisão dos principais instrumentos de análise exploratória de dados, sendo que estes procedimentos podem ser encontrados em cursos de estatística básica e em livros de estatística básica como Costa Neto (1979), Bussab e Morettin (1987), Triola (1999), Lopes (1999), entre outros.

2.1. A distribuição de freqüências e o histograma

A distribuição de freqüências consiste em agrupar as observações de uma variável em classes ou categorias e o histograma é uma das representações gráficas dessa distribuição. A distribuição de freqüências e o histograma podem ser obtidos em programas computacionais comercias com o Excel, Statistica e em programas específicos para análise geoestatística, como, por exemplo, o GS+.

A finalidade da distribuição de freqüências e do histograma é a de permitir uma visualização do comportamento da variável em estudo, com relação à tendência de concentração de dados (tendência simétrica ou assimétrica). Esta tendência, principalmente na análise não espacial de dados, pode direcionar procedimentos diferenciados de análise.

2.2. As estatísticas

O cálculo de estatísticas como a média, a variância, o desvio padrão, o coeficiente de variação, valor mínimo, valor máximo, coeficiente de assimetria e coeficiente de curtose, colaboram na descrição da variável. Passaremos a rever rapidamente estas estatísticas.

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 4

- A média aritmética (X) A média aritmética é uma medida de posição bastante utilizada na estatística e tem como características principais à facilidade de cálculo, a sua adaptabilidade ao tratamento algébrico e, também, geralmente, é uma medida não tendenciosa, precisa, eficiente e suficiente.

Vale ressaltar que nem sempre a média aritmética é a medida de posição que melhor representa uma variável, por exemplo, em dados com assimetria à direita acentuada a moda ou a média geométrica pode representar melhor a variável em estudo. A fórmula para o cálculo da média é:

X n i em que: X é a média aritmética; xi é cada valor observado; n é o número total de observações.

- Variância (s2) e desvio padrão (s)

A variância e o desvio padrão são estatísticas que nos fornece uma idéia de variabilidade das observações em torno da média aritmética. As fórmulas de cálculo são, respectivamente:

)Xx(s n i

Note que em interpretações de dados, ou seja, na análise descritiva a média aritmética deve estar sempre acompanhada do desvio padrão para que possamos visualizar a dispersão média dos valores.

- Coeficiente de variação (CV)

O coeficiente de variação fornece a dispersão relativa dos dados, facilitando visualizar a dimensão da dispersão dos valores observados em relação à média. O coeficiente de variação é dado por:

UFU/FAMAT Geoestatística Básica e Aplicada

Prof. Dr. Ednaldo Carvalho Guimarães 5

- Valor Mínimo e Valor Máximo

Estes valores permitem visualizar a menor ocorrência e a maior ocorrência e podem ser um primeiro indicativo de erros de amostragem, digitação, etc.. A obtenção desses valores se faz a partir da ordenação das observações.

- Coeficiente de assimetria (Cs) e coeficiente de curtose (Ck) O coeficiente de assimetria mostra o afastamento da variável em relação a um valor central, ou seja, na distribuição simétrica tem-se 50% dos valores observados acima da observação central e 50% abaixo. Se a distribuição é assimétrica, esta relação não é observada.

O coeficiente de curtose mostra a dispersão (achatamento) da distribuição em relação a um padrão, geralmente a curva normal.

Estes dois coeficientes são utilizados para inferências sobre a normalidade da variável em estudo.

Antes de definirmos estes dois coeficientes e tecermos comentários sobre eles vamos definir os momentos estatísticos.

Se x1, x2,,xn são os n valores assumidos pela variável X, definimos o momento de

ordem t dessa variável como:

M n i

Note que se t=1 temos a média aritmética, ou seja, a média aritmética é igual ao primeiro momento em relação à origem.

O momento de ordem t centrado em uma constante K , com K ≠ 0 é definido como:

M n i

(Parte 1 de 9)

Comentários