Capitulo3 2013

Anlises Estatsticas Espaciais
Paulo Afonso Lopes e Marcos de Meneses Rocha
3
ANLISES EXPLORATRIAS
NO-ESPACIAL E ESPACIAL
3.1 Introduo
De modo semelhante estatstica clssica, antes de proceder a qualquer modelagem estatstica,
preciso fazer uma anlise exploratria dos dados. A anlise exploratria de dados o processo que
utiliza tabelas, grficos e medidas de representatividade (tambm chamadas medidas de tendncia
central) e de variabilidade para investigar um conjunto de dados e compreender suas caractersticas
mais importantes, tudo direcionado para identificar padres relacionamentos nos dados.
Divide-se em Anlise Exploratria No-espacial de Dados ou, simplesmente, Anlise Exploratria de
Dados (Exploratory Data Analysis EDA) e, no campo do espao, em:
a) Anlise Exploratria de Dados Espaciais ( Exploratory Spatial Data Analysis ESDA), e
b) Anlise Espao-Temporal de Dados Espaciais ( Exploratory Spatio-temporal Data
Analysis ESTDA).
A Anlise Exploratria No-espacial de Dados a clssica Estatstica Descritiva que inclui, por
exemplo, a mdia, a moda, a mediana e o desvio-padro. Estes, no contexto de dados espaciais,
representam resumos estatsticos de tabelas de atributos e valores de grade (grid), bem como
grficos como os histogramas e os diagramas de caixa.
A Anlise Exploratria de Dados Espaciais aplica tcnicas para descrever e visualizar distribuies
espaciais, identificar situaes atpicas e descobrir padres de associao espacial, conglomerados
(clusters) e sugerir regimes espaciais ou formas de heterogeneidade espacial empregando
representaes especficas que consideram a localizao dos dados, tais como Box Maps e mapas
de Moran (a serem vistos no pargrafo 3.6). Essa anlise de dados espaciais feita quando for
preciso considerar a importncia da disposio espacial dos fenmenos que originaram esses dados.
Na anlise espao-temporal, considera-se, agora, o tempo como um dos enfoques complementares
dos mesmos dados, o que conduz necessidade de se realizar uma anlise sistemtica da evoluo
de padres espaciais no tempo, alm da distribuio do comportamento temporal no espao.
Entretanto, devido s bases de dados espao-temporais serem complexas e, muitas vezes,
incompletas ou inconsistentes, usualmente os dados so divididos e explorados em estratos. Por
exemplo, classificar pessoas por idade, sexo ou nacionalidade ao longo do tempo.
Pgina 3-1
Como exemplo simples para distinguir estatstica no espacial da estatstica espacial, considere duas
amostras, A e B, obtidas em regies diferentes, conforme a Tabela 3.1:
Tabela 3.1 Dados de amostras obtidas em regies diferentes
Para a Estatstica Clssica, a mdia e o desvio-padro amostral so iguais para as duas amostras.
Entretanto, considerando a distribuio dos valores amostrais, a primeira amostra tem um
comportamento errtico, enquanto a segunda apresenta um comportamento regular (Figura 3.1)
Figura 3.1 Conjunto de valores iguais e representaes diferentes

Desse modo, os mtodos clssicos da Estatstica no conseguem reconhecer a diferena existente
entre as duas sries em estudo porque considera apenas os valores, sem considerar a posio
espacial relativa de cada um deles.
Os objetivos da anlise estatstica espacial so:
1. compreender a disposio dos dados, verificando se podem ser considerados aleatrios ou
tm um padro espacial nos locais observados;
2. testar hipteses relacionadas a essa disposio dos dados, e
3. estimar valores onde no h observaes.
Em resumo, nada mais do que a aplicao, no espao, dos conceitos de estimao de parmetros
e testes de hipteses da estatstica clssica. Para tanto, utilizam-se mtodos entre os quais se podem
citar os essencialmente voltados visualizao dos dados espaciais, mtodos exploratrios na busca
e no resumo das relaes e de padres e mtodos especificadores do modelo estatstico para a
estimao de parmetros.
Pgina 3-2
Ateno especial deve ser dada a padres inesperados de comportamento e aos valores
discrepantes (denominados outliers a serem vistos no pargrafo 3.6).
Inicialmente, ver-se- a fase de anlise exploratria, associada apresentao visual de dados (sob
forma de grficos e mapas) e a identificao de padres de dependncia espacial no fenmeno em
estudo. Nos captulos 4 a 7, sero vistos o processo de modelagem desses fenmenos.
3.2 Anlise exploratria no-espacial

3.2.1
Grficos
A visualizao grfica uma etapa importante da anlise espacial, porque ajuda a identificar padres
e relacionamentos espaciais nos dados e permite determinar as respostas para perguntas como as
seguintes:
h valores discrepantes em relao ao conjunto de dados?
as observaes podem ser classificadas em grupos distintos?
h relacionamento entre as variveis?
Entre os grficos mais utilizados na Cartografia destacam-se:

a) Histograma, tambm chamado histograma de freqncias;
b) Diagrama de caixa (conhecido tambm por grfico de caixa e boxplot), e
c) Diagrama de disperso (scatter plot).
3.2.1.1 Histograma:
Grfico composto por retngulos justapostos em que a base de cada um deles, no eixo das
abscissas, corresponde aos intervalos de classe e as suas alturas (no eixo das ordenadas)
representa, usualmente, a frequncia dos dados no respectivo intervalo de classe ou, ento, essa
frequncia de dados dividida pela amplitude do respectivo intervalo de classe (Figura 3.2).
Figura 3.2 Histograma
Pgina 3-3
3.2.1.2 Diagrama de Caixa (grfico de caixa ou boxplot):

Possibilita representar a distribuio de um conjunto de dados com base nos seguintes parmetros
descritivos:
valor mnimo
1. Quartil (Q1)
Mediana (Q2)
3.. Quartil (Q3)
valor mximo.
Com os valores de Q1 e Q3, calcula-se o chamado intervalo quartlico, IQR, (hinge em ingls), uma
medida de disperso.
IQR = Q3 - Q1
Os valores de (Q1 - 1.5IQR) e
(Q3 + 1.5IQR) so os limites alm dos quais os dados so
considerados discrepantes (outliers, conceito a ser visto em no pargrafo 3.2.2).

O grfico tem o seguinte aspecto: a parte central um retngulo, em cujo interior h uma linha
horizontal que mediana. O limite inferior do retngulo indica o valor do 1. Quartil e o limite superior
o 3. Quartil.
A partir do limite inferior, traa-se uma haste que se estende do 1. Quartil at o menor valor maior
que (Q1 - 1.5IQR), onde se traa outra linha horizontal.
A partir do limite superior, traa-se uma haste que se estende do 3. Quartil at o maior valor menor
que (Q3 + 1.5IQR), onde se traa outra linha horizontal.
Os dados com valores inferiores a (Q1 - 1.5IQR) e superiores a (Q3 + 1.5IQR) so representados
individualmente e considerados discrepantes (outliers) (Figura 3.3). Dependendo de quem analisa o
problema, o valor do intervalo interquartlico pode ser multiplicado por 3, conforme ocorre no
programa GeoDa.
Pgina 3-4
Figura 3.3. Diagrama de caixa
3.2.1.3
Diagrama de disperso (scatter plot)
O diagrama de disperso cartesianos, ou seja, os conhecidos diagramas x-y (Figura 3.4)

um grfico onde pontos no espao cartesiano XY so usados para representar
simultaneamente os valores de duas variveis quantitativas medidas em cada elemento do
conjunto de dados. Este o melhor mtodo de examinar os dados no que se refere
ocorrncia de tendncias (lineares ou no), agrupamentos de uma ou mais variveis,
mudanas de espalhamento de uma varivel em relao outra e verificar a ocorrncia dos
chamados outliers. O Moran scatterplot um exemplo deste tipo de diagrama e ser visto
em outro captulo.
Tabela 3.2 Dados
Observao Varivel X Varivel Y
1
Pgina 3-5
Figura 26: Esquema do diagrama de disperso.

Figura 3.4 Diagrama de disperso
EXERCCIO 3.1
1. Construir, no programa GeoDa, um diagrama de caixa dos dados do PIB dos estados brasileiros.
Dica: File Open Project. Varivel-chave: OBJECTID. Explore Box Plot.
2. Indicar o que representa o nmero 27 no diagrama de caixa.
3. Indicar o que representa a linha vermelha no interior do diagrama.
4. Identificar os estados brasileiros que podem ser considerados outliers superiores.
Dica: Para visualizar os estados, selecione o asterisco correspondente e observe no mapa e
na tabela os estados selecionados.
5. Clicar, com o boto direito, em qualquer local da janela do diagrama de caixa e selecionar a opo
hinge 3.0. Justificar as mudanas ocorridas, se houverem.
EXERCCIO 3.2
Repetir, no ArcGIS, o Exerccio 3.1
Dica: Tool Graphs Create.
Pgina 3-6
EXERCCIO 3.3
1. Construir, no GeoDa, o Box Map do PIB dos estados brasileiros.
Dica: Map Box Map Hinge = 1.5.
2. Comparar o Box Map com o diagrama de caixa.
Cuidado: Verificar se o Box Map e o diagrama de caixa esto com o mesmo valor de hinge.
3. Construir, no Geoda, e interpretar o diagrama de disperso.
Dica: Explore scatterplot.
4. Construir, no Geoda, o Box Map dos PIB dos estados brasileiros.
Dica: Map Box Map.
DESAFIO!
Descobrir a origem dos valores constantes nos eixo X e Y do diagrama de disperso no Geoda.
3.2.2 Incio do relacionamento com o espao a partir do diagrama

de caixas (boxplot): o Box Map
Os valores situados entre Q1 e Q2, Q2 e Q3, Q1 e intervalo quartlico inferior, Q3 e intervalo quartlico
superior, bem como os outliers inferiores e superiores podem ser visualizados por meio do chamado
Box Map, que apresenta, espacialmente, os valores do diagrama de caixa.
A Figura 3.5 apresenta, pelo programa GeoDa, o Box Map dos Estados Brasileiros. Verifique que,
comparando-se com o respectivo diagrama de caixa, pode-se verificar que os valores situados abaixo
da barra horizontal inferior denominam-se lower outliers e aqueles situados acima da barra horizontal
superior denominam-se upper outliers. Observe tambm que os estados com o PIB entre 25% e os
75% encontram-se na caixa central e que valores menores que 25% encontram-se entre a parte
inferior da caixa central e a barra horizontal inferior. Situao similar pode ser observada com os
valores maiores que 75%, os quais se encontram entre a parte superior da caixa central e a barra
horizontal superior.
Pgina 3-7
Figura 3.5. Box Map do PIB dos Estados brasileiros no ano de 2002.
3.3 Anlise exploratria espacial

Na Anlise Exploratria de Dados Espaciais (ESDA (Exploratory Spatial Data Analysis) est sendo
visto o conjunto de ferramentas estatsticas descritivas e grficas com o objetivo de descobrir padres
nesses dados, considerando, explicitamente, a importncia do arranjo espacial dos fenmenos,
anlise que pode ser classificada em univariada ou multivariada, dependendo do nmero de
variveis. Dentre as tcnicas univariadas, destacam-se os histogramas, mapas temticos, diagramas
de caixa (boxplots) e determinados ndices, enquanto entre as tcnicas multivariadas tem-se as
matrizes de proximidade.
Desse modo, a ESDA constitui-se em uma coleo de tcnicas para descrever e visualizar
distribuies espaciais, identificar situaes atpicas, descobrir padres de associao espacial e
tambm conglomerados (clusters).
Os objetivos da anlise espacial so compreender melhor as observaes espalhadas pelas reas,
avaliar hipteses a elas relacionadas, ou ainda prever valores em locais onde observaes no esto
disponveis. Em resumo, as anlises podem ser:
para visualizar os dados espaciais;
para explorar, conhecer, investigando e resumindo relaes e padres em mapas;
para identificar um modelo estatstico e estimar parmetros
Pgina 3-8
Um processo espacial chamado estacionrio se a dependncia entre as medidas da mesma

varivel no espao a mesma para todos os locais na rea. Se a dependncia de um processo
estacionrio influenciada pela distncia, mas a mesma em todas as direes, o processo
considerado isotrpico.
Os efeitos de primeira ordem descrevem variaes em larga escala na mdia do resultado de
interesse, devido localizao ou a outras variveis explicativas, enquanto os efeitos de segunda
ordem descrevem a variao em pequena escala devido s interaes entre vizinhos.
3.3.1 Efeitos de 1. Ordem

A anlise dos efeitos de primeira ordem busca identificar os padres de distribuio espacial
de uma determinada varivel. Nesse sentido, importante definir qual a regio em torno de
cada ponto ou rea que ser considerada para efeito de determinao de um valor numrico
que represente o padro da varivel em torno daquele ponto ou rea. Ser visto a seguir as
diferentes formas de definir essa regio em torno de cada ponto ou rea, representada por
matriz denominada de matriz de proximidade ou pela determinao de um vizinho mais
prximo.
Efeitos de primeira ordem incluem etapas como a determinao da regio de vizinhana e o
valor mdio da varivel nessa regio
A existncia de uma grande quantidade de reas de trabalho faz com que haja diferentes
tipos de relacionamento entre elas. Para que se possa identificar os padres espaciais
existentes, necessita-se inicialmente estabelecer o conceito de vizinhana, materializado por
meio das chamadas matrizes de proximidade espacial ou matrizes de vizinhana.
3.3.1.1 Matriz de proximidade

A construo de ua matriz de proximidade necessita, primeiro, da definio do que seja uma
proximidade espacial.
3.3.1.1-1 Proximidade Espacial

No que se refere ao conceito de Proximidade espacial, temos, usualmente, a
distncia euclideana. A principal diferena para objetos em reas reside na
formalizao da proximidade espacial. Por exemplo, qual a distncia entre a
cidade do Rio de janeiro e a cidade de Nova Iguau? 29 mim, 35 km ou so
juntas. Claro que a resposta depende de inmeros fatores.
Pgina 3-9
Distncia euclideana dada pela separao entre dois pontos quaisquer no

espao. Pode ser calculada a partir das coordenadas dos pontos. Se (x 1, y1) e
(x2, y2) so dois pontos no plano, ento a distncia dada por:
e se (x1, y1, z1) e (x2, y2, z2) forem as coordenadas de dois pontos no espao,
a distncia dada por:
A proximidade
wi,j
de uma regio Ai em relao a outra Aj pode
tambm ser definida de diversas maneiras, entre as quais:

a) existncia de uma fronteira comum, a mais imediata e fcil de
determinar, considerar como fator de deciso
wi,j = 1 se a regio
i faz fronteira com a regio j e wi,j = 0, caso contrrio.

Por exemplo, considere a Figura 3.6
Figura 3.6 Bairro da Urca (Rio de Janeiro, RJ) e bairros vizinhos

Fonte:
http://www.armazemdedados.rio.rj.gov.br/arquivos/1314_bairros%20%202004.JPG
Pgina 3-10
No caso do bairro da Urca (nmero 22),
w22,j = 1 com os bairros de
Botafogo (nmero 20) e Leme (nmero 23), ou seja,
w 22,20 = w 22,23=1
e w 22, j
b) distncia linear entre os centrides de cada rea, Figura 3.7
Figura 3.7 Distncia entre centrides de duas reas

Neste caso, se a distncia entre o centride de Ai e o centride de Aj
for menor ou igual a um determinado valor d, denominado limiar,
w i,j =
1; se maior que esse limiar, w i,j = 0.

Por exemplo, pode-se definir um raio mximo de 7,3 km em torno do
centride do bairro do Alto da Boa Vista (Rio de Janeiro, RJ), Figura
3.8
Figura 3.8 Raio de 7,3 km, escolhido para definir a proximidade do

bairro do Alto da Boa Vista em relao aos demais bairros da cidade do Rio
de Janeiro, RJ.
Pgina 3-11
Fonte: http://www.cederj.edu.br/atlas/rio_janeiro_tab4.htm
O valor de
w i,j
(onde i o bairro do Alto da Boa Vista e j so os demais
bairros) igual a 1 para os bairros cujas distncias de seus centrides ao

centride do Alto so menores ou iguais que 7,3 km e igual a zero para os
demais.
c) relao entre os comprimentos da interseo das reas e o
permetro da regio.
w i,j = lij/li, onde lij o comprimento da fronteira entre Ai e Aj e li o

permetro da rea Ai.
Figura 3.9 Proximidade pelos comprimentos

Para a Figura 3.9,
L
2
w
14
L
L
L
L
1
2
3
4
onde L2 o comprimento da interseco entre P1 e P4 e (L 1 + L2 + L3 +
L4 ) o permetro de P1. Observe que w i,j w j,i
d) o inverso da distncia linear entre os centrides:
wi, j
1
d
3.3.1.1-2 Determinao da Matriz de proximidade Espacial ou

Matriz de Vizinhana
Na anlise exploratria espacial, fazem-se as anlises considerando os
efeitos de uma varivel em toda a regio de trabalho globalmente ou em
sub-regies localmente em torno de alguma caracterstica.
Pgina 3-12
Cada uma dessas sub-regies delimita a vizinhana de um polgono,

representada matematicamente pelas chamadas matrizes de proximidade
espacial, de vizinhana ou de contiguidade.
Dado um conjunto de n polgonos {A1, An}, a matriz de vizinhana a matriz
W
(1)
(n x n), onde cada um dos elementos wij representa uma medida de
proximidade entre Ai e Aj. equivale ao relacionamento entre cada um dos

polgonos da regio de trabalho. Nessa matriz, os relacionamentos entre os
polgonos no vizinhos apresentam valor zero (wij = 0).
Figura 3.10 Estrutura (grid) de 3 x 3 clulas

Os critrios de contiguidade para a determinao dessa matriz de
proximidade para os elementos contguos so os seguintes:
1) Distncia da Torre (Rook distance) considera-se como vizinhas
as regies que apresentam lados em comum. Por esse critrio, em
um grid, as vizinhas de uma clula so aquelas ao norte, sul, leste e
oeste.
Exemplo 3.1 Em um grid de 3 x 3 clulas (Figura 3.10), as
clulas vizinhas da clula 1 pela distncia da Torre com
contiguidade 1 so as 2 e 4; da clula 2, clulas 1, 3 e 5; da
clula 5 so as clulas 2, 4, 6 e 8, e assim sucessivamente.
Exemplo 3.2 Em um grid de 3 x 3 clulas (Figura 3.10), as
clulas vizinhas da clula 1 pela distncia da Torre com
contiguidade 2 so 3, 5 e 7; da clula 2, clulas 4, 6 e 8; da
clula 5 so as clulas 1, 3, 7 e 9, e assim sucessivamente.
2) Distncia da Rainha (Queen distance) - considera-se como
vizinhas as regies que apresentam tanto bordas como vrtices em
comum. Em um grid, as clulas vizinhas so aquelas que esto ao
Pgina 3-13
norte, sul, leste e oeste, e mais as das direes nordeste, sudeste,

sudoeste e noroeste.
Quando a ordem de contiguidade igual a 2, as clulas vizinhas da
clula de referncia so aquelas vizinhas das de primeira ordem dela.
Exemplo 3.3 No grid da Figura 3.10, as clulas vizinhas da
clula 1 pela distncia da Rainha so as clulas 2, 4 e 5; da
clula 2, as 1, 3, 4, 5 e 6; da clula 5 so as clulas 1, 2, 3, 4,
6, 7, 8 e 9, e assim sucessivamente.
3) Distncia simples considera-se como vizinhas as regies cujos
centrides encontram-se a menos de uma dada distncia da regio
de referncia; pode-se, neste caso, associar um peso para cada um
desses vizinhos.
Exemplo 3.4 No grid da Figura 3.10, se clula mede 5km x
5km e definindo-se que clulas vizinhas so aquelas situadas
a menos de 6km, as clulas vizinhas da clula 1 so as 2 e 4;
da clula 2, as clulas 1, 3 e 5; da clula 5, as clulas 2, 4, 6
e 8, e assim sucessivamente.
4) Nmero de vizinhos mais prximos selecionam-se os k
vizinhos mais prximos como critrio de vizinhana.
Exemplo 3.5 No grid da Figura 3.10, as duas clulas vizinhas
da clula 1 so as clulas 2 e 4; da clula 2, as 1 e 3, ou 1 e 5
ou 3 e 5, considerando-se que todas as clulas so de igual
tamanho.
Pode-se
adotar,
considerados,
tambm,
como
comprimento
da
critrios
interseo
serem
entre
os
contornos de reas adjacentes em funo ou no do

permetro
das
reas.
Estas
condies
podem
ser
consideradas de modo isolado ou de modo hbrido.

comum normalizar as linhas da matriz para que a soma dos seus pesos
seja igual a 1.
A idia de matriz de vizinhana pode ser estendida para vizinhos de maior
(2)
(n)
ordem. Essas matrizes so representadas por W ,, W . Os coeficientes

(n)
das matrizes de ordem 1 so designados por wij e os de ordem n por wij .
Pgina 3-14
Para n regies {A1, An}, a partir das proximidades entre duas delas,
constri-se a matriz de vizinhana W nxn, onde cada um dos elementos
w i,j a
medida de proximidade entre Ai e Aj. . Considera-se que uma rea vizinha

a outra se houver uma fronteira comum.
w1,1
w1,1
W=
w1,1
w1,1
w
w
w
w
1,2
1,2
1,2
1,2
w
w
w
w
1,1
1,1
1,1
1,1
1,2
1,2
1,2
w
w
w
w
1,2
Por exemplo, a matriz de vizinhana para os bairros da cidade do Rio de

Janeiro, 1-Sade, 2-Gamboa, 3-Santo Cristo, 5-Centro e 8-Cidade Nova
(Figura 3.11), a da Tabela 3.3.
Figura 3.11 Bairro do Centro (Rio de Janeiro, RJ) e bairros vizinhos

Fonte:
http://www.armazemdedados.rio.rj.gov.br/arquivos/1314_bairros%20%202004.JPG
Tabela 3.3 Matriz de vizinhana do bairro do Centro do Rio de Janeiro, RJ
Sade
Gamboa
Santo Cristo
Centro
Cidade Nova
Sade
Gamboa
Santo Cristo
Centro
Cidade Nova
Pgina 3-15
Pode-se normalizar as linhas da matriz para que a soma de cada linha seja igual a 1. Por
exemplo, a partir da matriz da Tabela 3.3 gera-se a matriz da Tabela 3.4
Tabela 3.4 Matriz normalizada de vizinhana do bairro do Centro do Rio de Janeiro, RJ

Sade
Gamboa
Santo Cristo
Centro
Cidade Nova
Sade
1/2
1/2
Gamboa
1/3
1/3
1/3
Santo Cristo
1/3
1/3
1/3
Centro
1/4
1/4
1/4
1/4
Cidade Nova
1/2
1/2
EXERCCIO 3.4
1. Determinar a matriz de proximidade do arquivo grid_teste_extrato no GeoDa, empregando a
distncia de Torre, contiguidade 1.
Dica: File Open Project. Varivel-chave: ORDEM. Tool Weights Create. Selecionar como
arquivo de entrada o grid_teste_extrato. Salvar o arquivo de sada no diretrio Exercicio_cap3 com o
nome torre_1 e, em seguida selecionar a opo desejada.
2. A partir do arquivo torre_1 (no bloco de notas):
a) Identificar o significado do nmero 9 na primeira linha do arquivo.
b) Determinar a lgica da construo do arquivo.
Dicas: Cada dupla de linhas subsequentes (linhas 2 e 3, 4 e 5, etc.) apresentam a
informao-chave.
EXERCCIO 3.5
Repetir o Exerccio 3.4 com a distncia da Torre, contiguidade 2, e comentar as diferenas, se
houverem.
EXERCCIO 3.6
Pgina 3-16
Repetir o Exerccio 3.4 com a distncia da Rainha, contiguidade 1, distncia mxima de 15 km e 3

vizinhos mais prximos.
EXERCCIO 3.7
1. Determinar a matriz de proximidade no programa TerraView.
Dica: Aps abrir o arquivo, selecionar Anlise Matriz de Proximidade Criar Matriz de
Proximidade. Selecionar a opo Contiguidade e salvar no diretrio Exerccio_cap3 o arquivo como o
nome contiguidade_terraview.
2. Comparar, no bloco de notas, os arquivos obtidos com o GeoDa com o do TerraView. Verificar os
relacionamentos e diferenas, se houverem.
3.3.1.2 Vizinho mais prximo

Esta estatstica apresenta a distncia, em mdia, de um ponto at o que considera seu
vizinho mais prximo.
O clculo dessa distncia feito para aqueles pontos potencialmente mais prximos da
vizinhana. Um ponto pode ser o vizinho mais prximo a vrios pontos, ou a nenhum ponto
absolutamente. Um modo de explorar a variao da tendncia espacial dos dados
calculando a mdia dos valores vizinhos e determinando-se distncia mdia, d-barra.
Nota: O fato de que A o vizinho mais prximo de B no quer dizer que B sempre ser o
vizinho mais prximo a A.
3.3.1.3 Determinao da aleatoriedade de distribuio de pontos no

espao
Um procedimento utilizado para determinar o padro de distribuio de pontos no espao
calcular o indicador denominado R, smbolo para a estatstica do vizinho mais prximo, que
mede o desvio entre o afastamento real dos pontos e o que ocorreria se os mesmos
estivessem posicionados de modo aleatrio.
Pgina 3-17
Figura 3.12 - Padres de distribuio de pontos
Pelo Clculo das Probabilidades, a distncia aleatria entre os pontos, r(E), calculada pela
expresso
onde p a densidade dos n pontos em determinada rea, ou seja, p = n/rea.
A distncia entre os pontos na distribuio observada baseia-se nos vizinhos mais prximos
de cada ponto, indicada por uma mdia, r(A).
Na Figura 3.13, as setas indicam o vizinho mais prximo de cada um dos pontos na rea
considerada.
Pgina 3-18
Figura 3.13 Vizinhos mais prximos
A distncia, em quilmetros, entre cada ponto e seu vizinho mais prximo, indicada por d,
est na tabela 3.5. Quando houver mais de um vizinho mais prximo, optar por um deles, j
que as distncias so iguais. O ponto mais prximo do ponto 2 o ponto 4, do 9 a 10 e
assim sucessivamente, conforme a Tabela 3.5.
Tabela 3.5 Pontos e seus vizinhos mais prximos

Ponto
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
Vizinho mais prximo

2
1
2e8
5
4
7
6
4
10
18
11
13
12
15
14
15 e 17
18
17
Distncia (km)
12
12
20
10
10
7
7
16
20
18
11
13
12
15
14
15 e 17
18
17
Os pontos 6 e 7 so, reciprocamente, os mais prximos, enquanto o ponto 3 igualmente

prximo dos pontos 2 e 8. Visualmente, uma concluso preliminar que os contatos na rea
so realizados por quatro grupos de pontos, relativamente isolados entre si.
A mdia das distncias entre os vizinhos mais prximos expressa por
ou seja, para ir de um ponto a outro, o deslocamento , em mdia, 11,9km para ir para um

ponto mais prximo ao original.
Aps essa determinao, compara-se a distncia real obtida com a terica, que ocorreria
2
caso a distribuio fosse aleatria. Supondo uma rea de 9.000km , a densidade p de pontos
2
de 0,002 pontos/km . A distncia entre os pontos, em quilmetros, caso a distribuio fosse
Pgina 3-19
aleatria seria:
O valor de R obtido, dividindo-se r(A) por r(E), ou seja:
Interpretao:
a) em uma distribuio aleatria, R=1.
b) sob condies de agregao mxima, R=0, uma vez que todos os pontos ocupam o
mesmo local e a distncia ao vizinho mais prximo , portanto, 0.
c) sob condies de espaamento mximo, os pontos sero distribudas em um padro
hexagonal, e cada ponto (exceto os da periferia) sero equidistantes de seis outros
pontos. Neste caso, a distncia mdia ao vizinho mais prximo ser maximizada e R =
2,1491.
Desse modo, quanto mais prximo R for de 1, maior a tendncia aleatoriedade.
Pelo resultado obtido, a distribuio de pontos da Figura 3.13 pode ser considerada aleatria.
EXERCCIO 3.8
Determinar, no programa GeoDa, a distncia ao vizinho mais prximo das capitais brasileiras.
Dicas:
1) Selecionar o arquivo Capitais e criar um arquivo de matriz de proximidade com a opo kNearest Neighbor com o valor 1.
2) Exportar como Near1.
3) Abrir o arquivo Near1 no bloco de notas e verificar os resultados, identificando os valores
direita de cada linha da tabela e concluindo sobre a coerncias deles.
4) Repetir o procedimento no ArcGIS e conferir os resultados.
Dica: No ArcGIS, selecione no Toolbox Analysis Tools Proximity Near.
4) Concluir sobre a distribuio das cidades: agrupada, regular ou aleatria? Justificar.
3.3.1.4 Mdia mvel espacial

Pgina 3-20
Um modo de estudar a variao da tendncia espacial dos dados calculando o valor de

cada atributo em relao aos atributos das regies vizinhas, valor chamado de Mdia
Espacial Mvel (conceito diferente da mdia mvel da estatstica clssica). Este mdia
espacial mvel nada mais do que uma mdia ponderada do atributo de cada regio em
relao aos seus vizinhos, que resulta no novo valor do atributo. Regies onde existe
disparidade entre o valor original do atributo e o valor da mdia espacial mvel indicam
pontos de transio entre padres espaciais.
A Mdia Espacial Mvel para cada regio i calculada pela seguinte expresso:
n
wi, j yj
i = j=1n
wi, j
para i=1, 2, ..., n
j=1
onde
Wi,j o elemento
da matriz de vizinhana. yi o valor do atributo na rea i e n o
nmero de reas.
Exemplo 3.6 Determinar a mdia espacial mvel para a rea A, Figura 3.14. considerando a
proximidade pela relao de fronteiras.
20
24
15
Figura 3.14 Regio de estudo com 4 reas A, B, C e D e seus atributos

A matriz de vizinhana a da Tabela 3.6.
Tabela 3.6 Matriz de vizinhana das reas A, B, C e D
A
A mdia espacial mvel para a regio A a seguinte:
Pgina 3-21
w
y
Aj
j
y
W
y
W
y
W
y
0
x
20
1
x
15
1
x
24
0
x
5
j
=
A
,
B
,
C
,
D W
AA
A
AB
B
AC
C
AD
D
A 4
W
W
0
W
AA
AB
AC
AD
Aj
j
=
1
0
x
20
1
x
15
1
x
24
0
x
5
0
x
20
1
x
15
1
x
24
0
x
5
0
15
24
0 0
0 2
= 19,5
O valor do atributo da regio A em relao aos valores dos atributos das regies
vizinhas est na Figura 3.15
19,5
Figura 3.15 Novo valor do atributo da regio A
EXERCCIO 3.9
Determinar as mdias mveis para as regies B, C e D da Figura 3.14.
EXERCCIO 3.10
Representar, matricialmente, o clculo das mdias mveis
para as regies A, B, C e D da Figura 3.14.
EXERCCIO 3.11
1. Determinar, no TerraView, a mdia mvel espacial dos dados do arquivo grid_teste, considerando
a contiguidade como critrio para a matriz de vizinhana.
Pgina 3-22
Dica: Criar primeiramente a matriz de vizinhana e depois em Anlise Estatstica Espacial,

selecionar a coluna VALOR1 - Mdia Mvel - prefixo cont e salvar com o nome grid_cont no diretrio
Exercicio_cap3.
2. Verificar a criao da coluna com o nome contLocalMean.
Cuidado: A numerao das clulas dada pelos valores da coluna object_id_<n> e no pelo
valor do registro da linha na tabela. Notar que, assim como no GeoDa, os arquivos com a extenso
GAL e txt da matriz de vizinhana fazem referncia ao valor do registro na tabela.
3. Selecionar as clulas de nmeros 25 e 32 (em relao coluna object_id_<n> ) e calcular o valor
da mdia mvel espacial e conferir o resultado na coluna contLocalMean.
Dica: Clicar na clula que se deseja calcular a mdia da vizinhana na tabela e, depois, sobre
o grid, clique sobre as clulas que se deseja calcular a mdia. Verificar que ocorre uma seleo
cumulativa. Para retirar essa seleo, clicar novamente sobre a clula.
Cuidado: A mdia mvel ocorre somente entre os vizinhos e NO inclui o valor da clula em torno da
qual se determina a mdia mvel.
4. Criar uma simbologia cuja legenda seja dividida em 5 classes pelo critrio dos quartis.
Dica: Clicar com o boto direito sobre o tema grid_teste e selecionar a opo Editar Legenda.
3.3.2 Efeitos de 2. Ordem

Nos efeitos de segunda ordem, busca-se determinar os relacionamentos entre variveis.
Sero abordados diversos tipos de ndices que de alguma forma empregam diferentes
abordagens do conceito de correlao aplicados ao caso de dados geogrficos.
Os efeitos de segunda ordem, no contexto de uma anlise exploratria espacial, empregam o
conceito de autocorrelao espacial e descreve a variao em pequena escala devido s
interaes entre vizinhos.
No lugar de verificar o relacionamento de duas variveis no-espaciais ou de uma mesma
varivel em instantes de tempo diferentes, representa o relacionamento de uma mesma
varivel em posies geogrficas diferentes. A autocorrelao pode ser calculada tanto em
uma regio de estudo (global) como em uma vizinhana (local).
3.3.2.1 O conceito de covarincia e correlao
Pgina 3-23
Quando h duas sries de dados, ou seja, duas variveis X e Y, as medidas estatsticas mais
comuns que podem ser usadas para indicar como essas duas sries se relacionam so a
covarincia e a correlao.
Para duas sries de dados, X (X1, X2,.) e Y(Y1,Y2... ), a covarincia fornece uma medida
absoluta do seu grau do relacionamento, sendo calculada pelo produto dos desvios para cada
varivel em relao sua mdia, ou seja, COV (X,Y) =
Se X e Y so independentes, ento a sua covarincia zero. O inverso, no entanto, no

verdadeiro: possvel que X e Y no sejam independentes e terem no entanto covarincia
zero.
O sinal da covarincia indica o tipo de relacionamento entre as duas variveis. Se positivo,
indica que elas movem no mesmo sentido; se negativo, em sentidos opostos. Entretanto, por
ser medida absoluta, relativamente difcil julgar o relacionamento entre as duas variveis,
porque as unidades dos valores podem mascarar esse relacionamento ou seja, por causa das
medidas no serem padronizadas.
Desse modo, contorna-se essa situao pelo uso da chamada correlao, medida
padronizada da relao entre duas variveis. Ela calculada dividindo-se a covarincia pelo
produtos dos desvios-padro de cada varivel. Essa correlao tambm chamada de
coeficiente de correlao de Pearson ou coeficiente de correlao produto-momento ou ento
"r de Pearson", o qual mede o grau da relacionamento (e o sentido desse relacionamento se positivo ou negativo) entre duas variveis de escala intervalar ou proporcional.
Calcula-se o coeficiente de correlao de Pearson pela expresso:
onde
so os valores de cada uma das variveis sendo
as mdias aritmticas de ambas as variveis.
3.3.2.2 Interpretao do coeficiente de correlao

Pgina 3-24
A correlao, denotada por r, encontra-se sempre entre -1 e +1. Uma correlao prxima a
zero indica que as duas variveis no esto relacionadas linearmente. No entanto, pode
existir uma dependncia no linear. Assim, o resultado r = 0 deve ser investigado por outros
meios.
Usamos o termo correlao positiva quando r>0, e nesse caso medida que, em mdia, x
aumenta, y tambm aumenta, e correlao negativa quando r < 0 e, nesse caso, medida
que x aumenta, y diminui.
O valor de r est sempre entre -1 e +1, com r=0 correspondendo no associao linear.
Quanto maior o valor de r (positivo ou negativo), mais forte a associao linear. Nos
extremos, se r= +1 ou r= - 1, ento todos os pontos no grfico de disperso esto todos
exatamente na mesma linha reta. Por outro lado, se r=0 no existe nenhuma associao
linear.
Note que correlaes no dependem da escala de valores de x ou de y (por exemplo,
obteramos o mesmo valor se medssemos altura e peso em metros e quiilogramas ou em
ps e libras.)
No h regra fixa para descrever uma correlao em palavras, dado o valor numrico. Uma
das classificaes est no Quadro 3.1.
Quadro 3.1 Interpretao dos valores da correlao
Valor do mdulo da correlao
Interpretao
0,00
Nenhuma
0,00 -- 0,20
Bem fraca
O,20 |-- 0,40
Fraca
O,40 |-- 0,70
Moderada
O,70 |-- 0,90
Forte
Pgina 3-25
O,90 |-- 1,00
Muito forte
1,00
Perfeita
No campo espacial, a partir do conceito de correlao, tem-se o de autocorrelao, medida

que indica, o quanto o valor de uma varivel est relacionada com seus vizinhos ou ento
com a regio em que se encontra.
3.4 Indicadores de Autocorrelao Espacial

Tem-se os chamados Indicadores Globais (ndices de Moran, Geary, G e G*) e os
Indicadores Locais (ndices de Moran Local, Geary Local, G i e Gi*), alm dos multivariados da
associao espacial, uma generalizao em mltiplas dimenses.
Os Indicadores medem o quanto o valor observado de um atributo em uma regio
independente dos valores desse atributo nas localizaes vizinhas, e podem ser expressos
de um modo genrico, tanto para os indicadores globais quanto para os locais.
1. Define-se um indicador local como sendo
(i,j = 1, ..., n)
Onde wij a medida de proximidade entre o objeto i e os j situados na sua
vizinhana, e aij representa a associao entre o atributo do objeto i com os dos
demais objetos de sua vizinhana.
2. Define-se um indicador global como sendo
,
para (i,j = 1, ..., n), quando se analisa o conjunto de todos os objetos de toda a regio.
Os valores para o clculo desses indicadores podem ser as observaes originais ou,
mais apropriadamente, alguma transformao destas, a fim de lidar apenas com as
Pgina 3-26
diferenas em relao media do conjunto, ou seja, verifica-se o quanto uma

observao desvia-se da mdia do conjunto, definindo-se a varivel
A partir dessa transformao, definem-se 3 indicadores para cada um dos objetivos

desejados:
a) determinar a interao entre os pontos a partir dos seus afastamentos em
relao mdia deles, ou seja:
b) determinar a disperso absoluta entre um par de observaes i e j
c) determinar o valor ou a diferena simples entre eles:

ou
equivalente a
ou
No primeiro caso, temos o ndice de Moran, similar covarincia da Estatstica

Clssica
No segundo caso, o ndice de Geary, similar varincia da Estatstica Clssica
No terceiro caso ,os ndices G ou G*, semelhantes mdia mvel da Estatstica
Clssica
3.4.1 - Indicadores Globais (ndice I de Moran, ndice de Geary

e ndices G e G*)
3.4.1.1. ndice Global I de Moran:
Este ndice permite estabelecer se existe um padro aleatrio de distribuio de pontos ou
reas ou se h algum tipo de dependncia espacial entre eles. O ndice I de Moran, uma
medida de autocorrelao espacial desenvolvido por Patrick A. P. Moran [Figura 3.16], pode
variar entre -1 e +1, sendo que o valor negativo significa correlao espacial negativa e (+1)
correlao espacial positiva.
Pgina 3-27
Figura 3.16. Patrick Alfred Pierce Moran (July 14, 1917 September 19, 1988),
A hiptese implcita de estacionaridade de primeira e segunda ordens, o que torna o ndice sem
validade para dados no-estacionrios.
O termo estacionaridade tem sua origem em processos aleatrios. Por estacionaridade de processos
aleatrios entende-se como sendo aqueles cujas propriedades estatsticas no variam com o tempo.
No caso da anlise espacial, a estacionaridade do processo est associada com a estacionaridade no
espao, sendo descrita em termos de ordem: primeira ordem, segunda ordem etc. Os processos
estacionrios de primeira ordem devem ter mdia constante, independentemente da configurao
espacial dos pontos amostrados. A estacionaridade de segunda ordem implica que a funo de
autocorrelao depende somente da separao das observaes no espao e no no tempo.
O efeito da estacionaridade de primeira ordem est em desconsiderar o fato dos vizinhos terem
valores mais prximos que reas distantes, tendo em vista serem comparados mdia global, o que
torna o ndice maior do que deveria ser. A estacionaridade de segunda ordem (varincia constante)
faz com que os valores das varincias sejam menores nas regies com maior varincia e maior nas
reas com menor varincia.
O ndice I de Moran indica se os dados so um conglomerado ou a disposio aleatria.

Tem-se um conjunto de valores (zi) e um conjunto de pesos wij .Uma das maneiras mais simples para
atender esses critrios o de multiplicar os valores das diferenas:
Ponderando pela proximidade entre eles, tem-se
Pgina 3-28
Os padres de proximidade, dados pela matriz espacial de pesos, W = (wij), indicam os elementos
que devem ser includos ou excludos.
A expresso semelhante, na Estatstica clssica,
covarincia, que depende fortemente da quantidade de valores (quanto mais valores, maior a
covarincia).
Para evitar essa influncia, divide-se pela soma das ponderaes utilizadas, ou seja,
Para padronizar esta covarincia, ficando adimensional, divide-se pela varincia dos dados:
Finalmente, a relao entre essas duas expresses gera o ndice, conhecido como I
de Moran,
Outra maneira de expressar este ndice o seguinte;
onde: n o nmero de reas, xi o valor do atributo considerado na rea i, X-barra

representa o valor mdio do atributo na regio de estudo, e wij os pesos atribudos
conforme a conexo entre as reas i e j.
Em geral, um valor do ndice de Moran:
a) prximo a 1,0 indica um conglomerado de regies com as mesmas
caractersticas, autocorrelao espacial positiva.
Pgina 3-29
b) prximo a -1,0 indica aleatoriedade em que as regies prximas podem ter

comportamentos muito diferentes entre si, autocorrelao espacial negativa.
c) iguais a zero indicam independncia espacial.
Exemplo 3.7 Determinar o ndice de Moran para a Figura 3.17.
Figura 3.17. Representao para o Exemplo 3.17

Desenvolvimento:
Matriz de proximidade
25
21
25
21
(25-21)
25
21
Clculo intermedirio
25
21
Resposta: I = 0,487
EXERCCIO 3.12
Determinar o ndice de Moran para a Figura 3.18.
B
20
Pgina 3-30
15
Figura 3.18. Representao para o Exemplo 3.7

Resposta: I = 0,288
(k)
Generalizando para o caso de matrizes de proximidade W , a estimativa da funo de

autocorrelao, considerando os vizinhos de ordem k, est representada pela equao abaixo:
n n
n
w
(y
y
)(y
y
)
(k)
i
j
ij
i=
1 j=
1
I(K)
=
n
(y
y
)2
i
i=
1
EXERCCIO 3.13
1. Determinar o ndice de Moran para PIB do arquivo grid_teste no GeoDa, pelo critrio da distncia
da rainha, contiguidade 1.
Dica: Criar matrix de proximidade pelo critrio solicitado primeiramente e, em seguida, Space
Univariate Moran para determinar o ndice de Moran.
2. Observar que gerado um scatterplot.
3. Determinar o ndice de Moran no TerraView.
Dica: Anlise Estatstica Espacial Nmero de permutaes = 99.
4. Comparar os dois resultados.
3.4.1.2. ndice Global C de Geary:

Pgina 3-31
Enquanto o ndice I de Moran uma medida global de autocorrelao espacial, h outro

indicador, o ndice de Geary, mais sensvel s posies. Este ndice de Geary difere do de
Moran por utilizar diferena entre os pares de pontos, enquanto que Moran utiliza a diferena
entre cada ponto e a mdia global.
O ndice de Geary adequado quando no h
estacionaridade.
Com essa considerao, define-se o ndice de Geary por
O valor desse ndice varia entre 0 e 2. O valor 1 indica no haver autocorrelao espacial.
Valores menores que 1 significam autocorrelao espacial negativa e maiores que 1,
autocorrelao positiva. Este ndice foi desenvolvido por Roy C. Geary (Figura 3.19).
Figura 3.19. Robert (Roy) Charles Geary (April 11, 1896 February 8, 1983)
EXERCCIO 3.14
Determinar o ndice de Geary para a situao da Figura 3.20.
Figura 3.20 Grfico para o Exerccio 3.14
3.4.1.3. Funes G e G*
Ao contrrio do ndice de Moran e do ndice de Geary, as funes G e G* apresentam
os valores dos desvios Zi e Zj combinados em relao mdia.
Pgina 3-32
w ij z i . z j
G=
i= 0 j= 0
n
n
zi . z j
i= 0 j= 0
para i j.
n
w z .z
ij i
G*=
i=0 j=0
n n
z .z
i
i=0 j=0
A principal diferena entre as funes G e G* que a primeira inclui, no numerador, a soma dos
valores de todos os vizinhos, exceto o valor no local i, ao passo que G* o considera.
EXERCCIO 3.15
Determinar os ndices G e G* para a situao da Figura 3.20.
Figura 3.20 Grfico para o Exerccio 3.15
3.4.2 - Indicadores Locais de Associao Espacial (Local Indicators

of Spatial Association - LISA): ndice local de Moran e ndices Gi e
Gi*
Pgina 3-33
Como vimos, o estimador de autocorrelao espacial I de Moran fornece um valor nico como medida
da associao espacial. Por outro lado, muitas vezes necessrio examinar padres numa escala
maior. Neste caso, preciso utilizar indicadores locais de associao espacial que possam ser
associados a diferentes localizaes de uma varivel distribuda espacialmente.
A utilizao destes indicadores em conjunto com os indicadores globais, refinam nosso conhecimento
sobre o processos que originam a dependncia espacial, e permitem avaliar diferentes regimes
espaciais existentes na rea de estudo, porque medem a associao espacial entre uma observao
i e sua vizinhana.
Entre seus requisitos, temos:
soma dos ndices locais deve ser proporcional ao ndice global.
necessrio indicar a significncia da associao espacial para cada observao.
Os LISA podem ser empregados com o propsito de identificar:

a)
bolses de no estacionaridade dos dados, denominados hot-spots
b) a influncia de cada uma das reas sobre a estatstica global

c) reas com valores discrepantes.
3.4.2.1 ndice local de Moran

Permite obter o ndice de Moran para cada unidade espacial individual, calculando-se a
significncia estatstica para cada unidade de rea i e sua expresso :
para i diferente de j
3.4.2.2 ndices locais Gi e Gi*

O ndice local de Moran pode apresentar alguns problemas em sua interpretao, em funo
de sua distribuio estatstica no ser conhecida perfeitamente e ter de ser estimada por
simulaes. Por isso, interessante o uso das funes normalizadas Gi e Gi*.
Pgina 3-34
As funes Gi e Gi* so dois ndices de autocorrelao espacial local, que permitem o

teste de hipteses sobre a concentrao espacial da soma dos valores, associados aos
pontos na vizinhana do ponto considerado.
Uma vez que estes indicadores so compostos por um somatrio de valores de
atributos, a observao de valores significativamente altos de Gi e Gi* indica a existncia de
ocorrncia desse atributo em valores altos, sendo o oposto um indcio de agrupamento de
valores baixos.
A principal diferena entre as funes Gi e Gi* que, na primeira, consideram-se
apenas os valores dos vizinhos e na segunda considera-se tambm a regio em estudo no
clculo do ndice, ou seja, para i = j.
3.5 Grficos espaciais: LISA MAPs

aquele que indica as regies que apresentam correlao local significativamente diferente do resto
dos dados.
3.5.1 Mapa de significncia LISA (LISA significance map)

Uma outra forma de anlise por meio do mapa denominado, usualmente, apenas por LISA Map.
Na gerao do LISA MAP, os ndices locais so classificados como:
a) no significantes, ou seja, os pontos so no correlacionados
b) com significncia de 95% 99% e 99,9%, ou 0,05, 0,01 e 0,001%
3.5.2 Visualizao do Moran scatterplot (Moran Map - MM)

Uma outra forma de anlise por meio do mapa denominado Moran Map. Neste caso, os ndices
locais so associados ao diagrama de espalhamento de Moran.
Nota: este resultado apresenta somente as regies para os quais os valores dos ndices foram
considerados significantes.
A visualizao do Moran scatterplot compara o valor do desvio do valor da varivel em relao
mdia global (Zi) com o desvio do valor da varivel em relao mdia regional (WZi).
Pgina 3-35
Aps, classifica-se a variabilidade espacial em High-High (HH), Low-Low (LL), High-Low (HL) e LowHigh (LH), referindo-se ao valores de Zi e WZi , respectivamente.
Portanto um local que conste como High-Low, apresenta valores da varivel acima da mdia global e
abaixo da mdia local.
O MM espacializa os dados considerados estatisticamente significativos, classificados segundo os

quatro quadrantes do Diagrama de Espalhamento de Moran (DEM).
A figura 3.21 apresenta o Moran Map para o PIB dos Estados Brasileiros no ano de 2002 destacando
os estados brasileiros cujos PIBs encontrma-se acima ou abaixo da mdia global e acima ou abaixo
da mdia local, e que apresentam significncia estatstica. Os valores da significncia estatstica
podem ser vistos no LISA Map.. Tendo em vista a visualizao do Moran scatterplot fazer uma
comparao global e regional entre valores da varivel, preciso definir, nesse caso, a matriz de
proximidade ( no GeoDa, pelo comando Tools Weights)
Figura 3.21 Moran Map do PIB dos Estados brasileiros no ano de 2002.
3.5.3 Diagrama de Espalhamento de Moran - DEM (Moran Scatterplot)

Neste chamado diagrama, a variabilidade espacial pode ser expressa por meio de um grfico
scatterplot, em cujas regies ocorrem aglomerados espaciais (autocorrelao positiva), que esto
Pgina 3-36
representados como High-High (HH) na parte superior-direita e como Low-Low (LL) na parte inferioresquerda. As regies de spatial outliers (autocorrelao negativa) encontramse na parte inferior
direita como High-Low (HL) e na parte superior esquerda como Low-High (LH).
A interpretao de High-High de uma regio acima da mdia global, entre vizinhos tambm acima
da mdia. O caso de High-Low de uma regio acima da mdia global e abaixo dos vizinhos.
Os valores do Map Moran, independentemente de sua significncia estatstica, podem ser
visualizados no Moran Scatterplot, conforme a Figura 3.22.
Figura 3.22 Diagrama de disperso do PIB dos Estados brasileiros no ano de 2002.
O DEM pode ser apresentado na forma de um mapa coropltico bidimensional, onde cada polgono
apresentado indicando-se seu quadrante no diagrama de espalhamento. Ele representa
espacialmente o relacionamento entre os valores dos desvios e os valores das mdias locais,
indicando diferentes regimes espaciais presentes nos dados.
EXERCCIO 3.16
1. Determinar o ndice Local de Moran (LISA) no TerraView com os dados do arquivo <grid_teste>.
Dica: Anlise - Estatstica Espacial Atributo VALOR1 - ndice Local de Moran (LISA)
Permutaes = 999 Prefixo da coluna = cont. Observar que foram criadas as as colunas contZ,
contWz e contMoranIndex.
2. Explicar o significado das colunas contZ, contWz, contMoranIndex. Selecionar 3 registros da tabela
e conferir os valores numricos.
Dica: preciso conhecer a mdia e o desvio-padro do VALOR1.
3. Construir os mapas coroplticos dos valores de contZ, contWz e contMoranIndex.
Dica: Boto direito sobre grid_teste Editar Legenda Modo = Quantil Atributo = <camada
a ser criado o mapa>.
Pgina 3-37
4. Construir o Box Map a partir da coluna contBoxMap do TerraView.

Dica: Boto direito sobre grid_teste Editar Legenda Modo = Valor nico Atributo =
contBoxMap.
5. Calcular o ndice de Moran no GeoDa e relacionar com o scatterplot gerado com os valores contZ e
contWz.
6. Indicar o que se pode inferir sobre os pontos situados em cada um dos quadrantes.
Dica: Observar que o Box Map no TerraView visualiza o scatterplot do GeoDa (cuidado com
as nomenclaturas).
7. Relacionar cada quadrante com o respectivo valor numrico no TerraView.

Para o 1. Quadrante no Scatterplot, o valor numrico no Terraview 1, para o 2. _______, para o
3 _________ e para o 4, o valor numrico no Terraview ________.
8. Observar que a coluna contLISAsig mostra o valor da eststica p do teste de hiptese, o qual indica
a no existncia de autocorrelao espacial quando os valores so maiores que 0,05. Alm disso.
que que o contLISAMap apresenta valores 0 para p>0,05 e apresenta somente os valores p<0,05.
No GeoDa, o mapa equivalente denomina-se LISA Significance Map, sendo que neste so
apresentados diretamente os valores de p, enquanto que, no TerraView, associam-se valores
inteiros(1 para p=0,05; 2 para p=0,01; 3 para p=0,001).
A coluna contMoranMap equivale ao LISA Cluster Map do GeoDa. O TerraView associa valores
inteiros aos clusters ( 0 para no significante; 1 para Q1 (alto-alto), 2 para Q2 (baixo-baixo), 3 para
Q3 (alto-baixo) e 4 para Q4 (baixo-alto)).
9. Determinar os valores dos ndices G e G*.
Dica: Anlise Estatstica Espacial Atributo = VALOR1 G e G* - Significncia = 999 Prefixo =
cont. Observar a criao das colunas contG e contGStar.
10. Selecionar 3 registros da tabela e determinar os valores de G e G*, manualmente, e conferir com
os resultados do TerraView.
Pgina 3-38

Capitulo3 2013

Загружено:

Сведения о документе

Оригинальное название

Авторское право

Доступные форматы

Поделиться этим документом

Поделиться или встроить документ

Параметры публикации

Этот документ был вам полезен?

Это неприемлемый материал?

Авторское право:

Доступные форматы

Capitulo3 2013

Загружено:

Авторское право:

Доступные форматы

Anlises Estatsticas Espaciais

Paulo Afonso Lopes e Marcos de Meneses Rocha

Anlises Estatsticas Espaciais

Paulo Afonso Lopes e Marcos de Meneses Rocha

Figura 3.1 Conjunto de valores iguais e representaes diferentes

Anlises Estatsticas Espaciais

Paulo Afonso Lopes e Marcos de Meneses Rocha

3.2 Anlise exploratria no-espacial

h valores discrepantes em relao ao conjunto de dados?

as observaes podem ser classificadas em grupos distintos?

h relacionamento entre as variveis?

Entre os grficos mais utilizados na Cartografia destacam-se:

Figura 3.2 Histograma

Anlises Estatsticas Espaciais

Paulo Afonso Lopes e Marcos de Meneses Rocha

3.2.1.2 Diagrama de Caixa (grfico de caixa ou boxplot):

3.. Quartil (Q3)

(Q3 + 1.5IQR) so os limites alm dos quais os dados so

considerados discrepantes (outliers, conceito a ser visto em no pargrafo 3.2.2).

Anlises Estatsticas Espaciais

Paulo Afonso Lopes e Marcos de Meneses Rocha

Figura 3.3. Diagrama de caixa

Diagrama de disperso (scatter plot)

O diagrama de disperso cartesianos, ou seja, os conhecidos diagramas x-y (Figura 3.4)

Anlises Estatsticas Espaciais

Paulo Afonso Lopes e Marcos de Meneses Rocha

Figura 26: Esquema do diagrama de disperso.

Anlises Estatsticas Espaciais

Paulo Afonso Lopes e Marcos de Meneses Rocha

3.2.2 Incio do relacionamento com o espao a partir do diagrama

Anlises Estatsticas Espaciais

Paulo Afonso Lopes e Marcos de Meneses Rocha

3.3 Anlise exploratria espacial

para visualizar os dados espaciais;

para explorar, conhecer, investigando e resumindo relaes e padres em mapas;

para identificar um modelo estatstico e estimar parmetros

Anlises Estatsticas Espaciais

Paulo Afonso Lopes e Marcos de Meneses Rocha

Um processo espacial chamado estacionrio se a dependncia entre as medidas da mesma

3.3.1 Efeitos de 1. Ordem

3.3.1.1 Matriz de proximidade

3.3.1.1-1 Proximidade Espacial

Anlises Estatsticas Espaciais

Paulo Afonso Lopes e Marcos de Meneses Rocha

Distncia euclideana dada pela separao entre dois pontos quaisquer no

de uma regio Ai em relao a outra Aj pode

tambm ser definida de diversas maneiras, entre as quais:

i faz fronteira com a regio j e wi,j = 0, caso contrrio.

Figura 3.6 Bairro da Urca (Rio de Janeiro, RJ) e bairros vizinhos

Anlises Estatsticas Espaciais

Paulo Afonso Lopes e Marcos de Meneses Rocha

No caso do bairro da Urca (nmero 22),

w22,j = 1 com os bairros de

Botafogo (nmero 20) e Leme (nmero 23), ou seja,

b) distncia linear entre os centrides de cada rea, Figura 3.7

Figura 3.7 Distncia entre centrides de duas reas

1; se maior que esse limiar, w i,j = 0.

Figura 3.8 Raio de 7,3 km, escolhido para definir a proximidade do

Anlises Estatsticas Espaciais

Paulo Afonso Lopes e Marcos de Meneses Rocha

(onde i o bairro do Alto da Boa Vista e j so os demais

bairros) igual a 1 para os bairros cujas distncias de seus centrides ao

w i,j = lij/li, onde lij o comprimento da fronteira entre Ai e Aj e li o