Вы находитесь на странице: 1из 126

CRISTINA HENRIQUES NOGUEIRA

ANLISE DE VARINCIA COM


DEPENDNCIA ESPACIAL SOB UMA
ABORDAGEM GEOESTATSTICA

LAVRAS - MG
2013

CRISTINA HENRIQUES NOGUEIRA

ANLISE DE VARINCIA COM DEPENDNCIA ESPACIAL


SOB UMA ABORDAGEM GEOESTATSTICA

Dissertao apresentada Universidade


Federal de Lavras,
como parte
das exigncias do Programa de
Ps-Graduao
em
Estatstica
e
Experimentao Agropecuria, rea
de concentrao em Estatstica e
Experimentao Agropecuria, para a
obteno do ttulo de Mestre.

Orientador
Dr. Renato Ribeiro de Lima

LAVRAS - MG
2013

Ficha Catalogrfica Elaborada pela Diviso de Processos


Tcnicos da Biblioteca da UFLA
Nogueira, Cristina Henriques.
Anlise de varincia com dependncia espacial sob uma
abordagem geoestatstica / Cristina Henriques Nogueira. Lavras :
UFLA, 2013.
123 p. : il.
Dissertao (mestrado) Universidade Federal de Lavras, 2013.
Orientador: Renato Ribeiro de Lima.
Bibliografia.
1. Covarincia. 2. Anlise de experimentos. 3. Semivariograma.
4. Erros dependentes. I. Universidade Federal de Lavras. II. Ttulo.
CDD 519.538

CRISTINA HENRIQUES NOGUEIRA

ANLISE DE VARINCIA COM DEPENDNCIA ESPACIAL


SOB UMA ABORDAGEM GEOESTATSTICA

Dissertao apresentada Universidade


Federal de Lavras,
como parte
das exigncias do Programa de
Ps-Graduao
em
Estatstica
e
Experimentao Agropecuria, rea
de concentrao em Estatstica e
Experimentao Agropecuria, para a
obteno do ttulo de Mestre.

APROVADA em 27 de fevereiro de 2013.


Dr. Jos Mrcio de Mello

UFLA

Dr. Marcelo Silva de Oliveira

UFLA

Dr. Renato Ribeiro de Lima


Orientador

LAVRAS - MG
2013

Aos meus pais, que so as bases da


minha vida, cuidando sempre com muito carinho
e dedicao do meu crescimento pessoal e
profissional.
minha sobrinha Luiza, que, sempre
me recebendo com abraos enforcantes e se
despedindo com lgrimas nos olhos, conseguiu
compreender que a minha ausncia se fazia
necessria.
DEDICO

AGRACECIMENTOS
Aos meus pais, por toda a confiana que depositaram em mim e
cada palavra de incentivo, sem os quais eu no teria conseguido concluir
esta etapa to importante.
A minha irm, Liliane, que fez do seu exemplo uma fonte
inspiradora, pelo constante apoio e por estar sempre ao meu lado, nas horas
mais difceis.
Ao meu irmo, Rogrio, que mesmo a distncia, sempre torceu pelo
meu sucesso. Aos demais familiares que me incentivaram.
Aos professores da Universidade Federal de So Joo del-Rei
(UFSJ), por suas contribuies e ensinamentos durante toda a graduao
em Matemtica.
Ao professor Dr.

Marcos Santos de Oliveira que, alm de

me apresentar Estatstica, permitiu que este sonho pudesse se tornar


realidade, incentivando e acreditando no meu potencial at os dias atuais.
Universidade Federal de Lavras e ao Programa de PsGraduao

em

Estatstica

Experimentao

Agropecuria,

pela

pela oportunidade concedida para a realizao deste trabalho.


Fundao de Amparo Pesquisa do Estado de Minas Gerais
(FAPEMIG), pela concesso da bolsa de estudos.
Ao professor Dr.

Marcelo Silva de Oliveira, pela confiana

depositada, pelas sugestes e crticas, alm do apoio e orientao durante o


primeiro ano do curso.
Ao meu orientador, Dr.

Renato Ribeiro de Lima, pelo

incondicional e inestimvel apoio, pela oportunidade de poder trabalhar


ao seu lado, alm dos preciosos ensinamentos compartilhados, meu sincero
agradecimento.
A todos os professores do Departamento de Cincias Exatas
(DEX), pela disponibilidade e pelos conhecimentos oferecidos durante o
curso.

Aos demais funcionrios do DEX, em especial Josi, pela boa


vontade e eficincia com que sempre me atenderam.
Marclia Teixeira, minha melhor amiga durante esses dois anos,
que, alm do curso e da repblica, dividiu tambm alegrias, tristezas, medos
e angstias. Sempre ao meu lado, possibilitou que essa jornada se tornasse
mais prazerosa.
s minhas amigas e companheiras de repblica, Sol Riveli, Priscila
Couto, Ksia Teixeira e Marlia Teixeira (in memoriam), pela amizade,
apoio e convvio ao longo desses dois anos.
A todos meus amigos que, mesmo longe, se fizeram presentes,
oferecendo sempre palavras de incentivo e apoio.
Aos membros participantes da banca examinadora, pelas sugestes
e valiosas contribuies.
Finalmente, a todos aqueles que, de alguma forma, acreditaram e
contriburam para a realizao deste sonho, meu muito obrigado.

RESUMO
Um dos princpios bsicos da experimentao a aleatorizao,
tendo como finalidade gerar uma distribuio de amostragem para os erros
experimentais, cujo comportamento assinttico aproxima-se de distribuies
normais no-correlacionadas.

Entretanto, nem sempre a prtica de

aleatorizao suficiente para neutralizar os efeitos de correlao entre


as parcelas adjacentes e, por isso, encontram-se experimentos cujos erros
apresentam uma estrutura de dependncia espacial definida. Uma maneira
para contornar esse problema utilizar uma abordagem espacial, em que
possvel estimar e modelar a correlao espacial entre os erros. Por meio
desses modelos espaciais a dependncia entre os erros deixa de ser vista
como uma inconvenincia a ser evitada, passando a ser considerada como
um verdadeiro benefcio, de forma que sua utilizao pode proporcionar
resultados mais precisos. Assim, este trabalho foi realizado com o objetivo
de descrever como implementar e executar a anlise de varincia com
erros espacialmente correlacionados, na qual a matriz de covarincia do
erros, modelada por meio de uma abordagem geoestatstica, utilizada
como ponderadora das somas de quadrados da anlise de varincia. Alm
disso, verificou-se, ainda, a aplicabilidade do teste F, o qual utilizado
para comparar a igualdade entre as mdias dos fatores controlados no
experimento. No intuito de avaliar a eficincia da abordagem geoestatstica,
foram analisados experimentos instalados sob os delineamentos inteiramente
casualizado (DIC) e em blocos casualizados (DBC) com diferentes nmeros
de parcelas.

Os dados foram obtidos via simulao, seguindo modelos

de covarincia esfrico e exponencial, com diferentes configuraes de


dependncia espacial. Os resultados obtidos mostraram que a modelagem da
correlao espacial dos erros foi mais eficiente, uma vez que produziu valores
maiores para a estatstica ??0, comparados aos valores obtidos pelo modelo
que supunha independncia espacial dos erros. Alm disso, a anlise espacial
produziu melhores estimativas para as mdias dos tratamentos. Com isso,
pode-se concluir que a utilizao de ferramentas geoestatsticas na anlise
de experimentos foi mais eficaz para detectar diferenas entre as mdias dos

fatores estudados.

Palavras-chave: Erros dependentes. Semivariograma. Covarincia. Anlise


de experimentos.

ABSTRACT
One of the essential principles of the experimentation is the
randomization which contributes towards the presuppositions which the
errors should be both equally and identically distributed, are met.
Nevertheless, not always the randomization practice is enough to counteract
the effects of correlation among the neighboring plots and for that
reason, experiments are found of which mistakes present a definite spatial
dependence structure. A way to bypass that trouble is to utilize a spatial
approach in which it is possible to estimate and model the spatial correlation
among the mistakes. So, the objective of this work was to report how
to implement and carry out the variance analysis with spatially correlated
errors in which the error covariance matrix, modeled through a geostatistical
modeling, was utilized as a weighting factor of the sums of squares of
the variance analysis. With the purpose of evaluating the efficiency of
the geostatistical approach, experiments established under the completely
randomized designs and in randomized blocks with different numbers of
plots. The data were obtained by simulation following spherical and
exponential covariance models with different settings of spatial dependence.
The results obtained showed that even in experiments presenting spatially
correlated errors, it is possible to continue to take advantage of the variance
analysis as a tool to compare the different sources of variability. Nevertheless
for that to occur, it is necessary for the error correlation matrix to be
regarded as a weighting factor of the sums of the squares. Besides, the
spatial error correlation modeling proved more efficient, since it produced
greater values to the F statistic, if compared with the values obtained by
the model which supposed spatial error independence. With this, one can
conclude that the use of geostatistic tools in the analysis of experiments
was more effective to detect differences among the means of the investigated
factors.

Key-words: Dependent errors.


experiments.

Semivariogram.

Covariance.

Analysis

LISTA DE ILUSTRAES

Figura 1

Grid de um experimento em DIC, com 15 tratamentos e


8 repeties . . . . . . . . . . . . . . . . . . . . . . . . . . 52

Figura 2

Grid de um experimento em DIC, com 6 tratamentos e 5


repeties

Figura 3

. . . . . . . . . . . . . . . . . . . . . . . . . . . 52

Grid de um experimento em DBC, com 15 tratamentos e


8 blocos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53

Figura 4

Grid de um experimento em DBC, com 6 tratamentos e 5


blocos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

Figura 5

Grid do experimento contendo informaes sobre os erros


referentes a cada ponto amostrado . . . . . . . . . . . . . . 94

Grfico 1

Relao entre as funes covarincia e semivarincia . . . . 20

Grfico 2

Exemplo de um semivariograma experimental com


comportamento ideal . . . . . . . . . . . . . . . . . . . . . 23

Grfico 3

Exemplos dos modelos tericos esfrico, exponencial e


gaussiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

Grfico 4

Modelos linear e potncia

. . . . . . . . . . . . . . . . . 29

Grfico 5

Modelo efeito pepita puro

. . . . . . . . . . . . . . . . . . 29

Grfico 6

Semivariograma dos erros contendo o envelope simulado . . 95

Grfico 7

Ajuste do modelo esfrico ao semivariograma dos erros . . 97

Grfico 8

(a) Semivariograma com ajuste do modelo terico da


componente espacial ^ e (b) dos erros estimados 0 . . . . 100

LISTA DE TABELAS

Tabela 1

Anlise de varincia para um delineamento inteiramente


casualizado. . . . . . . . . . . . . . . . . . . . . . . . . . . 39

Tabela 2

Anlise de varincia para um delineamento em blocos


casualizados. . . . . . . . . . . . . . . . . . . . . . . . . . . 43

Tabela 3

Valores fixos dos parmetros para os experimentos em DIC


com 15 tratamentos e 8 repeties. . . . . . . . . . . . . . 50

Tabela 4

Valores fixos dos parmetros para os experimentos em DIC


com 6 tratamentos e 5 repeties. . . . . . . . . . . . . . . 50

Tabela 5

Valores fixos dos parmetros para os experimentos em


DBC com 15 tratamentos e 8 repeties. . . . . . . . . . . 50

Tabela 6

Valores fixos dos parmetros para os experimentos em


DBC com 6 tratamentos e 5 repeties. . . . . . . . . . . . 50

Tabela 7

Valores dos parmetros do semivariograma utilizados para


simular o erro experimental. . . . . . . . . . . . . . . . . . 51

Tabela 8

Anlise de varincia de um DIC, considerando erros


correlacionados espacialmente. . . . . . . . . . . . . . . . . 69

Tabela 9

Anlise de varincia de um DIC, considerando = V 2 ,


por meio de formas quadrticas. . . . . . . . . . . . . . . . 69

Tabela 10 Somas de quadrados da anlise de varincia de um DIC,


obtidas por meio de modelos reduzidos. . . . . . . . . . . . 70
Tabela 11 Esperana dos quadrados mdios de um DIC com erros
correlacionados, a partir das somas de quadrados clssicas. 72
Tabela 12 Esperana dos quadrados mdios de um DIC considerando
erros espacialmente correlacionados. . . . . . . . . . . . . . 75

Tabela 13 Somas de quadrados para a anlise de varincia de um


DBC, por meio de reduo de modelos. . . . . . . . . . . . 80
Tabela 14 Anlise de varincia de um DBC, cujos erros so
espacialmente correlacionados. . . . . . . . . . . . . . . . . 81
Tabela 15 Esperana dos quadrados mdios de um DBC cujos erros
tm dependncia dentro dos blocos. . . . . . . . . . . . . . 83
Tabela 16 Esperana dos quadrados mdios de um DBC cujos erros
tm dependncia dentro e entre blocos. . . . . . . . . . . . 83
Tabela 17 Esperana dos quadrados mdios da anlise de varincia
de um DBC, considerando dependncia espacial. . . . . . . 84
Tabela 18 Avaliao da abordagem geoestatstica de um DIC com 15
tratamentos e 8 repeties. . . . . . . . . . . . . . . . . . . 89
Tabela 19 Avaliao da abordagem geoestatstica de um DIC com 6
tratamentos e 5 repeties. . . . . . . . . . . . . . . . . . . 89
Tabela 20 Avaliao da abordagem geoestatstica de um DBC com 15
tratamentos e 8 blocos, em relao ao efeito de tratamento. 91
Tabela 21 Avaliao da abordagem geoestatstica de um DBC com
15 tratamentos e 8 blocos, em relao ao efeito de bloco. . 91
Tabela 22 Avaliao da abordagem geoestatstica de um DBC com 6
tratamentos e 5 blocos, em relao ao efeito de tratamento. 92
Tabela 23 Avaliao da abordagem geoestatstica de um DBC com 6
tratamentos e 5 blocos, em relao ao efeito de bloco. . . . 93
Tabela 24 Parmetros estimados do semivariograma a cada iterao.

96

Tabela 25 Anlise de varincia, considerando erros correlacionados. . 98


Tabela 26 Anlise de varincia, considerando erros independentes. . . 98

SUMRIO
1
2
2.1
2.1.1
2.1.2
2.1.3
2.1.4
2.2
2.2.1
2.2.2
2.2.3
2.2.4
3
3.1
3.2
3.3
3.4
4
4.1
4.2
4.2.1
4.2.2
4.2.3
4.2.4
4.3
4.3.1
4.3.2
4.3.3
4.4
4.5
5

INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
REFERENCIAL TERICO. . . . . . . . . . . . . . . . . . . . . . . . 15
Geoestatstica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Estacionariedade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
Estimao do semivariograma . . . . . . . . . . . . . . . . . . . . . . 21
Modelos tericos de semivariograma . . . . . . . . . . . . . . . . 25
Modelos espaciais lineares. . . . . . . . . . . . . . . . . . . . . . . . . . 30
Estatstica Experimental . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
A anlise de varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
Delineamento inteiramente casualizado (DIC) . . . . . . . 36
Delineamento em blocos casualizados (DBC) . . . . . . . . 40
Abordagem espacial na experimentao . . . . . . . . . . . . . 44
MATERIAIS E MTODOS . . . . . . . . . . . . . . . . . . . . . . . . 49
Simulao de dados. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
Estimao de parmetros . . . . . . . . . . . . . . . . . . . . . . . . . . 54
Modelagem geoestatstica do erro. . . . . . . . . . . . . . . . . . . 56
O teste F da anlise de varincia . . . . . . . . . . . . . . . . . . . 60
RESULTADOS E DISCUSSES. . . . . . . . . . . . . . . . . . . . 63
Estimao de parmetros considerando = V 2 . . . . . . 63
Delineamento inteiramente casualizado (DIC) . . . . . . . 65
Estimao de parmetros via modelos particionados . . 65
Anlise de varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
Esperanas dos quadrados mdios . . . . . . . . . . . . . . . . . . 71
Aplicabilidade do teste F . . . . . . . . . . . . . . . . . . . . . . . . . . 75
Delineamento em blocos casualizados (DBC) . . . . . . . . 78
Anlise de varincia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
Esperanas dos quadrados mdios . . . . . . . . . . . . . . . . . . 82
Aplicabilidade do teste F . . . . . . . . . . . . . . . . . . . . . . . . . . 84
Anlise dos dados simulados. . . . . . . . . . . . . . . . . . . . . . . . 88
Exemplo de aplicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
CONCLUSES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
REFERNCIAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
ANEXOS. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

13

INTRODUO
A execuo do planejamento clssico de um experimento baseia-

se em trs princpios bsicos, estabelecidos por Ronald A. Fisher, que so:


repetio, aleatorizao e controle local. De forma sucinta, a repetio
responsvel pela estimao do erro experimental, a aleatorizao tem o
objetivo de proporcionar uma estimativa vlida para o erro, enquanto o
princpio de controle local tem a finalidade de tornar o experimento mais
eficiente, por meio da reduo do erro experimental, quando o mesmo
instalado em condies ambientais heterogneas.
A aleatorizao dos tratamentos considerada uma das principais
contribuies de Fisher, uma vez que essa prtica gera uma distribuio de
amostragem para os erros experimentais cujo comportamento assinttico
aproxima-se de distribuies normais nocorrelacionadas, proporcionando
erros independentes e identicamente distribudos com mdia zero e varincia
constante.
Entretanto, o processo de aleatorizao insuficiente para garantir
a independncia dos erros e, por isso, Grondona e Cressie (1991) alegam
que existem alguns casos em que, mesmo que a aleatorizao seja realizada,
as parcelas mais prximas so mais correlacionadas do que as mais
distantes, justificando-se a utlizao de alguma abordagem que modele essa
dependncia espacial.
importante ressaltar que a anlise de varincia clssica
desconsidera a informao sobre as posies espaciais das unidades
experimentais. Porm, uma vez sendo detectada a estrutura de correlao
espacial, a utilizao dessa informao na anlise estatstica fornece
estimativas mais eficientes para as mdias dos tratamentos, proporcionando
resultados mais precisos ou to bons quanto aqueles obtidos por meio da
anlise de varincia clssica. Entretanto, se tal estrutura de variabilidade
for desconsiderada, diferenas reais entre as mdias comparadas podem
no ser identificadas como significativas.

Duarte (2000) ainda defende

a utilizao de uma anlise que considere essa estrutura de depndencia

14

espacial, afirmando que a considerao da informao espacial pode tornarse um fator decisivo sobre as concluses de um experimento.
Com isso, o presente trabalho foi realizado com o principal objetivo
de desenvolver um material didtico, descrevendo, detalhadamente, como
implementar e executar a anlise de varincia com erros espacialmente
correlacionados, na qual a matriz de covarincia dos erros foi modelada
por meio de uma abordagem geoestatstica, em experimentos instalados
sob os delineamentos inteiramente casualizados e em blocos casualizados.
Nesse processo de desenvolvimento, foram ainda determinadas as esperanas
dos quadrados mdios, alm de verificar a aplicabilidade do teste F para
comparar a igualdade entre as mdias dos fatores em estudo.
O semivariograma foi utilizado como principal ferramenta para
detectar e descrever a estrutura de variabilidade espacial, de modo que
os modelos tericos ajustados ao mesmo foram utilizados para compor a
matriz de covarincia dos erros. Em sntese, a modelagem geoestatstica
do erro busca uma estimativa para a funo geral de covarincia, a qual
pondera, alm da soluo para o sistema de equaes normais (S.E.N), as
somas de quadrados da anlise de varincia.
Quanto estimao de parmetros, foram utilizadas as teorias
de quadrados mnimos generalizados e de mxima verossimilhana para
a obteno de estimadores para os parmetros do modelo, levando em
considerao a dependncia espacial dos erros.
Com o objetivo de verificar a relao entre a eficincia da anlise
espacial e as configuraes de dependncia geoestatstica, foram geradas
diferentes combinaes de valores dos parmetros do semivariograma,
seguindo modelos de semivarincia esfrico e exponencial.
Por fim, foi realizada uma comparao entre a anlise clssica,
cujos erros so considerados independentes e a anlise espacial, em que a
modelagem da correlao entre os erros foi feita por meio da Geoestatstica.
Nessa comparao avaliou-se o valor da estatstica do teste F da anlise de
varincia clssica e espacial, de modo que a anlise que produziu maiores
valores para essa estatstica foi considerada a mais eficiente.

15

REFERENCIAL TERICO
O referencial terico dividido em dois temas centrais, os quais

abordam a Estatstica Experimental e a Geoestatstica.


A necessidade do desenvolvimento e da utilizao de ferramentas
estatsticas, capazes de caracterizar a estrutura de variabilidad
A necessidade do desenvolvimento e da utilizao de ferramentas
estatsticas, capazes de caracterizar a estrutura de variabilidad
A necessidade do desenvolvimento e da utilizao de ferramentas
estatsticas, capazes de caracterizar a estrutura de variabilidad

2.1

Geoestatstica
A necessidade do desenvolvimento e da utilizao de ferramentas

estatsticas, capazes de caracterizar a estrutura de variabilidade espacial de


um determinado fenmeno, motivou o surgimento da teoria das variveis
regionalizadas ou, simplesmente, Geoestatstica.
No incio da dcada de 1950, Daniel G. Krige (engenheiro de
minas que trabalhava com a minerao de ouro na frica do Sul) observou
que era preciso considerar a existncia da variabilidade espacial para se
obter mtodos mais eficientes de estimao da concentrao de ouro. Esses
estudos despertaram o interesse de um engenheiro de minas francs chamado
George Matheron. J na dcada de 1960, Matheron conseguiu formalizar
essas teorias relacionadas variabilidade espacial, denominando-as de teoria
das variveis regionalizadas.
De acordo com Guerra (1988 citado por ROSSONI, 2011), as
variveis regionalizadas podem ser definidas como variveis cujos valores
esto relacionados de algum modo, com a posio espacial que ocupam, ou
seja, que variam de um lugar a outro do espao com uma certa continuidade.

16

Complementando essa definio, Ribeiro Jnior (1995) entende que a


Geoestatstica baseia-se na utilizao de um conjunto de procedimentos
estatsticos aplicveis a problemas nos quais os dados so espacialmente
referenciados.
natural pensar que, em fenmenos relacionados geologia,
cincias do solo, cincias florestais ou qualquer fenmeno cujos dados so
espacialmente correlacionados, a associao de variveis com dependncia
espacial em pontos distintos maior medida que se reduz a distncia entre
elas, ou seja, variveis amostradas em pontos mais prximos tendem a ser
mais similares, entretanto, essa similaridade menor medida que aumenta
a distncia entre os pontos amostrados.
Ribeiro Jnior (1995) salienta que a Geoestatstica no um
tipo especial, diferente ou alternativo de Estatstica.

A sua diferena

est no fato de que cada observao descrita no apenas pelo seu


valor, mas tambm por informaes de sua posio, expressa por um
sistema de coordenadas. Alm disso, a suposio de que as observaes
so independentes e igualmente distribudas no feita na Geoestatstica,
fazendo com que as medidas de correlao entre as observaes assumam
um papel fundamental na anlise.
Existem vrias medidas que se prestam descrio e modelagem
das relaes entre as distncias e a associao espacial dessas variveis,
tais como a autocovarincia, a autocorrelao e a semivarincia. O prefixo
auto se justifica por se tratar da correlao de uma varivel com ela mesma
em pontos diferentes. Durante este texto, a utilizao de tal prefixo ser
ignorada.
Na abordagem geoestatstica, a medida normalmente utilizada
a semivarincia, que pode ser definida como uma medida do grau de
dependncia espacial entre duas variveis. importante notar que, ao
contrrio da covarincia e da correlao, a semivarincia uma medida
de dissimilaridade, ou seja, maior medida que as variveis esto menos
associadas. Por exigir uma hiptese de estacionaridade menos restritiva
em relao s demais, a semivarincia a medida mais utilizada pelos

17

pesquisadores para descrever a estrutura de dependncia espacial (RIBEIRO


JNIOR, 1995).

2.1.1

Estacionariedade
A distribuio espacial de n valores amostrados de uma varivel

regionalizada Y pode ser modelada por um processo estocstico. Segundo


Oliveira (1991), um processo estocstico definido como uma coleo
{ () : R } de variveis aleatrias reais, definidas sobre um mesmo
espao de probabilidade, indexadas em um subconjunto R do espao vetorial
p-dimensional R , ou seja, R , em que R o espao indexador
das coordenadas x.
A Geoestatstica baseia-se no pressuposto de que a distribuio
espacial de uma varivel Y em uma regio R uma realizao {() :
R } de um processo estocstico, em que () representa a
realizao de uma varivel regionalizada () na posio x sendo que, no
caso bidimensional, representa o vetor de coordenadas (, ) de um ponto
amostrado.
Conforme afirma Oliveira (1991), o espao vetorial R pode ser
definido de tal maneira que seja possvel representar variaes aleatrias
em espaos de qualquer dimenso. Por exemplo, o espao vetorial = 1
utilizado para estudar principalmente as variaes no tempo, j = 2
estuda variaes em superfcies, enquanto = 3 utilizado em variaes que
ocorrem no espao tridimensional ou na superfcie-tempo e = 4 representa
variaes no espao-tempo.
Ao contrrio da anlise estatstica clssica, em que se trabalha
com n observaes de uma varivel aleatria, na teoria das variveis
regionalizadas tm-se n variveis aleatrias com apenas uma observao
cada, ou seja, no existe a repetio de uma mesma varivel. Essa restrio
no nmero de repeties impede o estudo da distribuio dessas variveis.
Por esse motivo, necessrio supor que o processo obedea a algum tipo de

18

estacionaridade.
Segundo Guimares (2004), um processo estacionrio se o
desenvolvimento do mesmo, no tempo ou no espao, ocorrer de forma
homognea, com pequenas oscilaes aleatrias contnuas em torno de
um valor mdio.

Desse modo, pode-se dizer que uma varivel ()

estacionria de ordem k, se:


[ ()] = 1 = constante x;
[ 2 ()] = 2 = constante x;
..
.

(2.1)

[ ()] = = constante x;
em que representa o k -simo momento da varivel ().
Vale ressaltar que uma varivel dita estacionria de ordem k
tambm estacionria para ordens inferiores a k, ou seja, estacionria de
ordem 1, 2, . . . , 1.
Na anlise geoestatstica necessita-se, como restrio mxima, que
a hiptese de estacionaridade de 2 ordem seja atendida. Segundo Journel
(1989), uma varivel () pode ser considerada estacionria de 2 ordem se
(i) a esperana de () existe e no depende da posio x, ou seja:
[ ()] = = constante;

(2.2)

(ii) a funo de covarincia () existe e depende apenas da distncia h


entre os pontos. Dessa forma,
( ( + ), ()) = [ ( + ) ()] 2 = ().

(2.3)

Desse modo, pode-se definir o covariograma como sendo um grfico


no qual so plotados, no eixo das ordenadas, os valores da covarincia em
funo das distncias, que so representadas no eixo das abcissas.
De acordo com a definio de estacionariedade de 2 ordem, podese observar, ainda, que a varincia () de uma varivel () um caso

19

particular da covarincia quando = 0:


( ()) = ( ( + 0), ()) = (0).

(2.4)

Apesar da pressuposio da estacionariedade de 2 ordem ser vivel


em muitos casos, essa uma hiptese muito restritiva, o que faz com que
nem sempre ela atendida. Por este motivo, comum utilizar uma hiptese
um pouco mais fraca, conhecida como hiptese intrnseca. Em estudos
geoestatsticos, necessrio, no mnimo, que a varivel em estudo obedea
a esta hiptese.
Segundo Cressie (1993), para que uma varivel seja intrinsicamente
estacionria necessrio que
(i) a esperana da diferena da varivel () nas posies x e x+h seja
nula,
[ ( + ) ()] = 0;

(2.5)

(ii) a varincia da diferena [ ( + ) () ] exista e no dependa da


posio espacial x,
1
1
[ ( + ) () ] = { [ ( + ) ()]2 } = (). (2.6)
2
2
em que () representa a medida de dependncia espacial denominada
semivarincia.

A utilizao do prefixo semi se d pelo fato de que

() representa a metade da varincia. Por convenincia matemtica, em


relao varincia, prefervel trabalhar com a semivarincia.

Sendo

assim, o semivariograma, um grfico no qual so plotados os valores das


semivarincias em funo das distncias h, desponta como uma ferramenta
fundamental na anlise geoestatstica.
Se um processo (ou varivel) estacionrio de segunda ordem, ele
tambm intrnseco, mas o inverso nem sempre ocorre. De acordo com
Journel e Huijbregts (1978), se a hiptese de estacionaridade de 2 ordem
for atendida, possvel estabelecer uma relao entre a covarincia () e
a semivarincia (), que dada por

20

() = (0) ().

(2.7)

Essa relao est representada graficamente no Grfico 1. Nesse


grfico pode-se observar que, quando h tende a infinito, () tende a zero
e () tende a (0).

Grfico 1

Relao entre as funes covarincia e semivarincia

Se uma varivel estacionria de segunda ordem, uma outra


medida que pode ser utilizada a correlao (), a qual definida como
sendo a razo entre a covarincia dos valores assumidos pela varivel Y, nas
posies e + e a varincia dessa varivel, em funo da distncia h.
Dessa forma, tem-se

() =

()
(0) ()
()
=
=1
.
(0)
(0)
(0)

(2.8)

Segundo Guimares (2004), esta funo tem a vantagem de ser


adimensional e estar limitada ao valor -1 e 1, permitindo comparaes entre
variveis e tambm inferncias sobre o grau de associao espacial. Porm,
percebe-se que, na prtica, a correlao de uma varivel com ela mesma em
pontos distintos varia entre 0 e 1, uma vez que, para = 0, a correlao
mxima, (0) = 1, e este valor vai decrescendo at o zero, ou seja, at uma
distncia em que no exista mais relao entre as observaes.

21

Uma alternativa para analisar analisar a dependncia espacial a


construo do correlograma, que nada mais do que um grfico no qual so
plotados os valores da correlao () em funo das distncias.
Com isso,

conforme afirma Pontes (2002),

se a hiptese

de estacionariedade de 2 ordem for atendida, o covariograma, o


semivariograma e o correlograma tornam-se ferramentas equivalentes para
caracterizar a dependncia espacial. Porm, em situaes cujo fenmeno
em estudo apresenta capacidade infinita de disperso, no qual somente a
hiptese intrnseca est sendo satisfeita, apenas o semivariograma pode
ser utilizado para descrever a dependncia espacial. Por este motivo, o
semivariograma se torna a ferramenta preferivelmente utilizada em uma
anlise geoestatstica.

2.1.2

Estimao do semivariograma
Conforme afirma Journel (1987), a anlise variogrfica uma arte,

no melhor senso do termo.

Segundo esse autor, artes requerem bons

instrumentos, como neste caso, um bom programa interativo, alm de


experincia e habilidade do pesquisador para sintetizar e, muitas vezes, ir
alm dos dados.
Na busca por uma estimao cada vez mais eficaz, surgiram
diversos estimadores de semivariograma. Segundo Ribeiro Jnior (1995),
a escolha de um estimador orientada por diversas propriedades, como
notendenciosidade, preciso, resistncia e robustez.
O estimador mais utilizado na literatura, proposto por Matheron
(1962), conhecido como estimador clssico ou, simplesmente, estimador
de Matheron. De acordo com Ribeiro Jnior (1995), esse estimador obtido
atravs do mtodo dos momentos e tem, sob suposio que a varivel atende
hiptese intrnseca, a qualidade de ser um estimador no tendencioso.
Conforme afirma Cressie (1993),

o estimador clssico de

semivarincia pode ser definido por meio da seguinte expresso:

22

()

1
[ ( ) ( + ) ]2 ,
^ () =
2 ()

(2.9)

=1

em que
^ () o estimador de semivarincia;
() representa o nmero de pares de valores medidos separados por uma
distncia h;
( ) e ( + ) so realizaes da varivel aleatria Y, nas coordenadas
e + , de tal modo que esses pontos esto separados por uma
distncia h.
Entretanto, esse estimador apresenta como desvantagem o fato
de ser influenciado por observaes atpicas (outliers), o que pode ser
justificado pelo termo ao quadrado que aparece no somatrio. Sendo assim,
se os dados apresentam outliers, outros estimadores de semivarincia devem
ser considerados para descrever a variabilidade espacial.
Um semivariograma tpico com caractersticas ideais, cuja varivel
atende estacionariedade de segunda ordem, pode ser ilustrado conforme o
Grfico 2.

23

Grfico 2

Exemplo de um semivariograma experimental com comportamento


ideal

Analisando esse semivariograma, pode-se observar que, quanto


mais prximos estiverem os pontos amostrados, maior ser a semelhana
entre eles e, portanto, menor a semivarincia. Pode-se observar, ainda, que
a semivarincia () cresce com o incremento de h, at atingir um valor
constante e, a partir deste ponto, as variaes tornam-se aleatrias, ou seja,
as variaes que ocorrem no podem ser justificadas pela semelhana de um
ponto com outro.
No Grfico 2 esto apresentados ainda os principais parmetros
do semivariograma. Segundo Isaaks e Srivastava (1989), esses parmetros
podem ser definidos como:
Alcance (): distncia dentro da qual as amostras apresentamse correlacionadas espacialmente. Esse parmetro representa o valor de
h para o qual o semivariograma atinge seu patamar.

Deste ponto em

diante, considera-se que no existe mais dependncia espacial entre os


pontos amostrados e, com isso, () torna-se invariante com a distncia.
Patamar ( 2 + 2 ): o valor da semivarincia correspondente ao
valor do alcance (), isto , () = 2 + 2 . O patamar corresponde,
teoricamente, varincia dos dados.

Variveis que atendem apenas

hiptese intrnseca no apresentam patamar definido.


Efeito

pepita

( 2 ):

representa

24

descontinuidade do semivariograma para distncias menores do que a menor


distncia observada na amostra. Teoricamente (0) = 0, porm, na prtica
percebe-se que a medida que h tende a zero, () aproxima-se de um valor
positivo chamado de efeito pepita ( 2 ). Esse parmetro est associado
variabilidade totalmente aleatria dos dados, ou seja, refere-se varincia
do erro experimental.
Contribuio (2 ): a diferena entre o patamar e o efeito
pepita.

Esse valor est associado varincia estrutural, ou seja,

variabilidade regionalizada que pode ser explicada por um modelo com uma
certa estrutura de dependncia espacial.
possvel avaliar e quantificar a dependncia espacial de uma
varivel.

Uma das medidas utilizadas para tal avaliao o grau de

dependncia. Essa medida representa nada mais do que a razo entre o valor
do efeito pepita e do patamar do semivariograma. Segundo Cambardella et
al. (1994), pode-se classificar uma varivel regionalizada, com relao ao
seu grau de dependncia espacial, da seguinte forma:
(i) varivel com forte dependncia espacial: se o efeito pepita for menor ou
igual a 25% do patamar, ou seja, 2 /( 2 + 2 ) 0, 25;
(ii) varivel com moderada dependncia espacial:

se o efeito pepita

representar entre 25% e 75% do patamar, isto , 0, 25 < 2 /( 2 +2 )


0, 75;
(iii) varivel com fraca dependncia espacial: se a relao entre efeito
pepita e patamar estiver entre 75% e 100% , ou seja, 0, 75 < 2 /( 2 +
2 ) < 1;
(iv) varivel independente espacialmente: se a relao entre efeito pepita
e patamar for igual a 100%. Neste caso, tem-se um semivariograma
com efeito pepita puro.

25

2.1.3

Modelos tericos de semivariograma


Conforme afirma Cressie (1993), a Geoestatstica baseia-se,

fundamentalmente, em dois conceitos: o semivariograma, cujo papel


descrever a estrutura da variabilidade espacial e a krigagem, que tem o
objetivo de predizer, no tendenciosamente e com varincia mnima, os
valores de um determinado atributo em pontos no amostrados. Desse
modo, como afirma Rossoni (2011), por meio de um processo discreto
de amostragem, possvel obter uma estimativa contnua de toda a rea
analisada.
Entretanto, Ribeiro Jnior (1995) reporta que, para assegurar que
o sistema de krigagem tenha soluo nica, necessrio que a matriz
de coeficientes desse sistema seja positiva definida. Consequentemente,
necessrio que o modelo de semivarincia seja negativo definido condicional.
De acordo com Cressie (1993), para que tal condio seja satisfeita, preciso
que

( ) 0,

(2.10)

=1 =1

para qualquer posio espacial 1 , 2 , . . . , , e qualquer 1 , 2 , . . . ,

R de tal modo que


= 0, Z+ .
=1

Diante dessa restrio, surge uma classe de modelos


que so definidos como modelos autorizados.

Alguns desses modelos,

frequentemente utilizados na literatura, so os modelos esfrico, exponencial


e gaussiano, cujas semivarincias so calculados por:
Modelo esfrico:

26

, = 0;
[ ( 0)
( )3 ]
1
3
() =

2 + 2
, 0 < < ;

2
2

2 + 2
, ;

(2.11)

Modelo exponencial:

() =

0
[

2 + 2 1 exp

)] , = 0;
, = 0;

(2.12)

Modelo gaussiano:

0
, = 0;
( )2
() =
3
2 + 2 1 exp
, =
0.

(2.13)

Exemplos desses modelos so apresentados no Grfico 3.

Os

modelos citados so conhecidos como modelos bem comportados, uma


vez que possuem patamares definidos, ou seja, a partir de um certo alcance,
a varincia se estabiliza. Porm, para os modelos exponencial e gaussiano,
o patamar obtido apenas assitoticamente. Para esses modelos, o alcance
determinado como sendo o valor da distncia na qual se alcana 95% da
contribuio (2 ), ou seja, () = 0, 952 . Esse alcance, representado na
expresso do modelo pela letra grega , tambm chamado de alcance
prtico, ou seja, a partir desse ponto considera-se que no existe mais
dependncia espacial.

27

Grfico 3

Exemplos dos modelos tericos esfrico, exponencial e gaussiano

No entanto, existem fenmenos em que o crescimento de ()


contnuo com o incremento de h. Fenmenos desse tipo apresentam varincia
infinita, atendendo somente hiptese intrnseca. Nesse tipo de situao,
comum ajustar o modelo potncia, que se caracteriza por no apresentar
patamar definido. A funo de semivarincia desse modelo dada por:
Modelo potncia:
{
() =

0
2

, = 0;

, = 0;

(2.14)

com 2 > 0, > 0 e 0 2, sendo que 2 refere-se ao efeito pepita, b e


representam, respectivamente, parmetros de curvatura e intensidade de
variao. Em modelos sem patamar, os parmetros alcance () e patamar
( 2 + 2 ) no tm interpretao prtica.
O modelo linear conhecido como um caso particular do modelo
potncia quando = 1. Nesse modelo, o valor da semivarincia () se
caracteriza por crescer linearmente com o aumento da distncia h. Exemplos

28

desse modelo e do potncia so apresentados no Grfico 4.


Existem ainda casos em que o semivariograma se caracteriza por
apresentar um conjunto de pontos oscilando aleatoriamente em torno de um
valor constante de (). Em fenmenos dessa natureza possvel ajustar um
modelo conhecido como modelo de efeito pepita puro. No Grfico 5 pode-se
obervar o comportamento desse modelo. A sua funo de semivarincia
dada por
Modelo efeito pepita puro:
{
() =

, = 0;

, = 0.

(2.15)

Se as informaes presentes em um semivariograma podem ser


explicadas por meio do ajuste de um modelo de efeito pepita puro,
provavelmente a varivel em estudo apresenta independncia espacial, ou
seja, toda a variabilidade presente nos dados aleatria. Em situaes como
essa, as prprias tcnicas usuais da estatstica clssica podem ser aplicadas
para analisar os dados. Contudo, o pesquisador deve estar ciente de que,
mesmo tendo ocorrido tal comportamento, pode ser que exista dependncia
espacial a distncias menores do que a menor distncia amostrada.

29

Grfico 4

Modelos linear e potncia

Grfico 5

Modelo
puro

efeito

pepita

Outros modelos tericos de semivariograma podem ser encontrados


em Journel e Huijbregts (1978). Alm destes modelos bsicos, Isaaks e
Srisvatava (1989) salientam que qualquer combinao linear desses modelos
atendem s condies de negativo definido condicional, o que amplia a
quantidade de modelos vlidos para ajustar um semivariograma.
No intuito de se ajustar um modelo terico ao semivariograma,
diversos mtodos so apresentados na literatura. Segundo Ribeiro Jnior
(1995), espera-se que o ajuste de um semivariograma seja eficiente
principalmente para pequena distncias. Este um dos motivos pelos quais
o ajuste a sentimento era amplamente utilizado. Por meio deste ajuste, as
estimativas dos parmetros so obtidas por meio da avaliao visual, sem
qualquer critrio formal de estimao. No entanto, pela subjetividade do
ajuste, este mtodo comumente questionado. Com isso, devido ao avano
dos recursos computacionais e apresentao de mtodos teoricamente
fundamentados, outros mtodos surgem como opo para o ajuste do
semivariograma.
Entre os mtodos frequentemente utilizados para o ajuste
dos semivariogramas destacam-se os de quadrados mnimos (ordinrios,
ponderados e generalizados), que tm como base o estimador de
semivarincia.

Alm desses, destacam-se ainda os mtodos de mxima

30

verossimilhana e mxima verossimilhana restrita, que so aplicados


diretamente ao conjunto de dados.

Maiores detalhes sobre os mtodos

citados acima podem ser encontrados em Cressie (1993), Diggle e Ribeiro


Jnior (2007) e McBratney e Webster (1986), entre outros.

2.1.4

Modelos espaciais lineares


Conforme se afirmou na seo 2.1.1, a distribuio espacial de

uma varivel () pode ser modelada por meio de um processo estocstico


{ () : R }. Pressupondo que () estacionria de segunda
ordem, pode-se representar essa varivel por meio de sua decomposio em
uma soma de trs componentes: uma tendncia constante, uma componente
aleatria, espacialmente correlacionada e, por fim, um erro experimental.
Desse modo, conforme afirma Burrough (1987), o valor da varivel aleatria
Y, na posio espacial , dada por:
() = () + () + ()

(2.16)

em que
() um componente determinstico, uma tendncia associada a um
valor mdio constante, de tal forma que [ () ] = ()

[ ( ), ( ) ] = 0, , ;
() uma varivel aleatria com dependncia espacial.

neste

componente que est a contribuio da Geoestatstica. Assume-se que


esta varivel tem mdia zero, [ () ] = 0 e funo de covarincia
[ ( ), ( ) ], parametrizada por , parmetro de alcance do
semivariograma. Se = , [ ( ), ( ) ] = 2 . Caso contrrio,
() assume algum valor, que no necessariamente zero;
() uma varivel aleatria no correlacionada, frequentemente
denominada erro experimental. Essa varivel distribuda com mdia
zero, [ () ] = 0, varincia dada pelo parmetro efeito pepita do

31

semivariograma, [ () ] = 2 e, se = , [ ( ), ( ) ] = 0,
, .
As variveis () e () so definidas de tal modo que
[ (), () ] = 0, ou seja, () e () so espacialmente independentes.
Com isso, para qualquer posio espacial , , tem-se que a mdia e
a covarincia da varivel aleatria () so dadas por
[ () ] = ();
[ ( ), ( ) ] = 2 + 2 , se = ;

(2.17)

[ ( ), ( ) ] = [ ( ), ( ) ], se = .
De modo geral, supondo-se distribuio gaussiana, a distribuio
do vetor de erros aleatrios dada por (0, I 2 ), em que 0 corresponde
a um vetor de zeros e I representa uma matriz identidade de ordem n,
sendo n o nmero de valores amostrados da varivel Y. Da mesma forma, a
distribuio do vetor , referente componente espacialmente estruturada,
dada por (0, F2 ), sendo F uma matriz quadrada de ordem n, cujo
ij -simo elemento contm os valores da funo ( ), a qual corresponde
aos modelos de covarincia utilizados para descrever a variabilidade espacial
da varivel () nas posies espaciais e , de modo que =
a distncia euclidiana entre e .
Com isso, possvel concluir que o vetor , constitudo por ( )
em todas as posies espaciais amostradas, segue distribuio
gaussiana, de modo que (, I 2 + F2 ). No desenvolvimento deste
texto, comumente, (I 2 + F2 ) ser representado por . Para facilitar a
visualizao e a interpretao dessa matriz de covarincias, observe que:

[ (1 ), (1 ) ] [ (1 ), (2 ) ] [ (1 ), ( ) ]

[ (2 ), (1 ) ] [ (2 ), (2 ) ] [ (2 ), ( ) ]
=
..
..
..
..

.
.
.
.

[ ( ), (1 ) ] [ ( ), (2 ) ] [ ( ), ( ) ]

32

Sabe-se que, teoricamente, a varincia dos dados corresponde


ao patamar do semivariograma, e, com isso, tem-se que [ ( ) ] =
[ ( ), ( ) ] = 2 + 2 , = 1, . . . , . Alm disso, assumindo que a
varivel () estacionria de segunda ordem, [ ( ), ( ) ] = ( ),
em que = . Por isso, a matriz pode ser reescrita como

2 + 2

( 12 )
=
..

( 1 )

( 12 ) ( 1 )
2 + 2
..
.
( 2 )

( 2 )
.
..
..

.
.

2
2
+

Considerando a decomposio dessa matriz como = I 2 + F2 ,


a matriz F , ento, dada por

( )

12

F=
..

( )
1
2

( 12 )
2

..
.
( 2 )
2

..

( 1 )

2
( 2 )

.
2

..

Tipicamente, em aplicaes geoestatsticas, um dos principais


interesses fazer predies sobre os valores () em toda a rea analisada.
Nesses casos, segundo Diggle e Ribeiro Jnior (2007), o problema de
predio reduz-se ao estudo da distribuio condicional de () dadas as
observaes ( ) como realizao das variveis aleatrias ( ), em que
. Esses autores afirmam ainda que, considerando um nico valor
0 , referente posio espacial 0 , sob suposio de modelo gaussiano, a
distribuio preditiva de [ 0 | ] gaussiana com mdia e varincia dadas
por
[ 0 | ] = [ (0 ) ] + 2 v (I 2 + F2 )1 ( ) e

(2.18)

33

[ 0 | ] = 2 2 v (I 2 + F2 )1 2 v.

(2.19)

em que v representa o vetor transposto de v, sendo que este, por sua vez,
um vetor cujo i -simo elemento dado por ( 0 ), = 1, . . . , , com
0 = 0 .
De maneira geral, dado um vetor com mdia zero, a esperana
do vetor [ | ] dada por
[ | ] = 2 V (I 2 + F2 )1 ( ),

(2.20)

sendo V uma matriz quadrada de ordem n, cujas colunas so formadas pelos


vetores v1 , . . . , v , ou seja

( 12 )
V=
..

( 1 )

( 12 ) ( 1 )
1
..
.
( 2 )

( 2 )
.
..
..

.
.

interessante notar que a matriz V simtrica, isto , V = V.


Vale ressaltar ainda que, se o efeito pepita ( 2 ) for nulo, as matrizes F e V
so idnticas.

34

2.2

Estatstica Experimental
A Estatstica Experimental uma cincia que tem como objetivo

estudar experimentos cujas etapas incluem o planejamento, a execuo, a


coleta e a anlise dos dados experimentais e interpretao dos resultados
obtidos.
Em 1925, Fisher estabeleceu trs princpios fundamentais para a
anlise de delineamentos experimentais, at hoje considerados o alicerce da
experimentao, que so: a repetio, a aleatorizao e o controle local.
(i) Repetio
A repetio refere-se ao nmero de parcelas que recebero um
determinado tratamento. Ela necessria para que se possa estimar o erro
experimental, sem o qual seria impossvel realizar qualquer tipo de inferncia
estatstica. O uso de um nmero adequado de repeties possibilita uma boa
estimativa do erro experimental, aumentando a preciso do experimento e,
com isso, melhorando as estimativas de mdias e diferenas entre mdias.
(ii) Aleatorizao
Esse princpio refere-se distribuio aleatria dos tratamentos
nas unidades experimentais, de tal modo que todos os tratamentos tenham
a mesma probabilidade de serem alocados em qualquer uma das unidades
experimentais, evitando, assim, que qualquer tratamento seja beneficiado
pela unidade experimental a ele designada.
Segundo Kempthorne (1977), a aleatorizao dos tratamentos
foi uma das principais contribuies de Fisher, uma vez que a prtica
da aleatorizao gera uma distribuio de amostragem para os erros
experimentais, cujo comportamento assinttico aproxima-se de distribuies
normais nocorrelacionadas. Por isso, Banzatto e Kronka (2006) afirmam
que a aleatorizao tem a finalidade de proporcionar uma estimativa vlida
para o erro experimental.

35

(iii) Controle local


O princpio de controle local tem a finalidade de tornar o
experimento mais eficiente, por meio da reduo do erro experimental. Este
princpio utilizado para atenuar problemas de heterogeneidade ambiental.
Segundo Hinkelmann e Kempthorne (1994), a ideia bsica do controle local
a partio do conjunto total heterogneo de unidades experimentais em
subconjuntos (blocos) que sejam os mais homogneos possveis. Com essa
restrio, a aleatorizao passa a ser feita dentro de cada bloco. Apesar de
frequentemente utilizado, importante ressaltar que este no um princpio
obrigatrio, uma vez que, se o experimento for implantado em um ambiente
homogneo, no necessria a sua aplicao.

2.2.1

A anlise de varincia
Uma das ferramentas para a anlise e a interpretao de dados,

proposta por Fisher, a anlise de varincia, comumente denotada por


ANOVA. De acordo com Banzatto e Kronka (2006), a anlise de varincia
uma tcnica que consiste na decomposio da varincia total (e dos
graus de liberdade) em partes atribudas s fontes de variao previamente
definidas no planejamento do experimento, alm de uma poro residual
correspondente aos fatores no controlados no experimento, de natureza
aleatria. O principal objetivo desta anlise avaliar as possveis fontes de
variao, verificando se existem diferenas significativas entre os nveis dos
fatores controlados.
Cochran (1947) lembra que, para a construo de uma anlise
de varincia, algumas pressuposies devem ser atendidas.

Estas

pressuposies so conhecidas como


1. aditividade: os efeitos dos fatores controlados e do erro devem ser
aditivos;
2. independncia:

os erros devem ser independentes, ou seja, a

36

probabilidade de que o erro tenha um determinado valor no deve


depender dos valores dos outros erros;
3. normalidade: os erros devem ser normalmente distribudos;
4. homogeneidade: os erros devem apresentar varincia comum.
Segundo Banzatto e Kronka (2006), as pressuposies citadas
acima so necessrias para garantir a validade do teste F, que tem como
finalidade comparar estimativas de varincias.

Por meio desse teste

possvel realizar inferncias sobre a hiptese de igualdade entre vrias mdias


dos nveis de algum fator de interesse.
Frequentemente,

teste

surge

pela

considerao da decomposio da variabilidade de um conjunto de dados


em termos de somas de quadrados. A estatstica 0 deste teste obtida
pela razo de quadrados mdios que, por sua vez, so obtidos pela diviso
da soma de quadrados de cada fator de interesse pelos seus respectivos graus
de liberdade.
Os valores dos quadrados mdios so estimativas de varincias que
refletem diferentes fontes de variabilidade. Essas fontes de variabilidade
esto relacionadas com o delineamento experimental planejado para o
experimento.
O delineamento experimental o plano de distribuio dos
tratamentos na rea experimental, ou seja, so as formas de distribuio
das parcelas experimentais na rea do experimento.

Os delineamentos

experimentais mais utilizados na literatura so os delineamentos


inteiramente casualizado (DIC) e em blocos casualizados (DBC).

2.2.2

Delineamento inteiramente casualizado (DIC)


O delineamento experimental inteiramente casualizado utilizado

quando a variabilidade entre as parcelas experimentais for muito pequena,


isto , praticamente inexistente. Devido a essa exigncia, este delineamento

37

s deve ser utilizado se houver homogeneidade entre as unidades


experimentais.
Nesse delineamento, os tratamentos so distribudos nas parcelas
de forma inteiramente aleatria, de modo que cada unidade experimental
tenha a mesma probabilidade de receber qualquer um dos tratamentos
estudados, sem nenhuma restrio no critrio de aleatorizao.
Por se fundamentar apenas nos princpios da aleatorizao e da
repetio, um experimento instalado em DIC deve ser implantado em locais
cujas condies experimentais possam ser controladas, de modo que o
princpio de controle local seja desnecessrio. O DIC, normalmente, mais
utilizado em experimentos de laboratrio ou em experimentos em vasos
e bandejas em casa de vegetao, onde h possibilidade de controle das
condies ambientais. A instalao do DIC no campo experimental exige
homogeneidade das condies ambientais (tais como, a fertilidade do solo,
a distribuio uniforme de gua e de iluminao, etc).
Segundo Banzatto e Kronka (2006), as principais vantagens do
delineamento inteiramente casualizado so:
(i ) um delineamento bastante flexvel, visto que o nmero de
tratamentos e de repeties depende apenas do nmero de parcelas
disponveis;
(ii ) o nmero de repeties pode ser diferente de um tratamento para
outro, embora o ideal seja que eles se apresentem igualmente
repetidos;
(iii ) a anlise estatstica simples, mesmo quando o nmero de repeties
por tratamento varivel;
(iv ) o nmero de graus de liberdade para o resduo o maior possvel;
(v ) o delineamento mais simples de ser instalado e conduzido.
Este delineamento possui apenas duas causas ou fontes de variao:
os tratamentos, que se referem ao efeito de um fator controlado e o resduo,
que reflete o efeito dos fatores no controlados. Desse modo, as variaes

38

de toda ordem, exceto apenas a variao que se atribui aos tratamentos,


compem o erro experimental. Sendo assim, se o experimento em DIC
for instalado em condies heterogneas, altos valores para a estimativa da
varincia residual sero obtidos.
O modelo estatstico deste delineamento dado por
= + + ,

(2.21)

em que
a observao do i -simo tratamento na j -sima repetio, com =
1, 2, . . . , e = 1, 2, . . . , ;
uma constante inerente a cada observao que, sob restrio de que

= 0, a mdia geral;
=1

o efeito do i -simo tratamento;


o erro aleatrio associado ij -sima observao, em que se supe
que (0, 2 ).
O objetivo da anlise de experimentos em DIC estimar as mdias
dos tratamentos e testar hipteses apropriadas para compar-las. Segundo
Montgomery (2008), para testar hipteses sobre as mdias dos tratamentos
necessrio assumir que os erros so normalmente e independentemente
distribudos com mdia zero e varincia comum, (0, 2 ). Se for
um efeito fixo, isso implica que
( + , 2 )

(2.22)

e que as observaes so mutuamente independentes.


Este autor ainda afirma que, definindo = + como a mdia do
i -simo tratamento, as hipteses apropriadas para testar a igualdade entre

39

as mdias so
0 : 1 = 2 = . . . =

(2.23)

1 : = , para algum = ,
ou, equivalentemente,
0 : 1 = . . . = = 0

(2.24)

1 : = 0, para algum .

O procedimento adequado para testar as hipteses sobre


a igualdade entre as mdias dos tratamentos a anlise de varincia. Antes
de apresentar o quadro de anlise de varincia, comum denotar como
a soma das observaes sujeitas ao i -simo tratamento e como a mdia
das observaes que receberam o i -simo tratamento. Similarmente,
representa a soma geral de todas as observaes do experimento e define
a mdia geral de todas as observaes. Simbolicamente, tem-se que
=

=1

=1 =1

Desse modo, de acordo com Banzatto e Kronka (2006), a anlise


de varincia para um delineamento inteiramente casualizado (DIC) com t
tratamentos e r repeties dada conforme a Tabela 1,
Tabela 1

Anlise de varincia para um delineamento inteiramente casualizado.

FV

GL

SQ

Tratamento

(t-1)

SQTrat

Resduo

t(r -1)

SQRes

Total

(tr -1)

SQT

QM
QMTrat =


t1

QMRes =
t(r1)

40

em que

1 2 2

,

=1

=1 =1

=1 =1

1 2
= .

=1

Segundo Barbin (1998), considerando que um efeito fixo,


ou seja, representa constantes a serem estimadas, as esperanas dos
quadrados mdios da anlise varincia da Tabela 1 so dadas por

[ ] = 2 +

[ ] = 2 .

(2.25)

=1

2.2.3

Delineamento em blocos casualizados (DBC)


Em 1925, Ronald A. Fisher idealizou os delineamentos em blocos,

cujo propsito era eliminar o efeito da heterogeneidade presente entre


as unidades experimentais na comparao dos tratamentos (princpio
de controle local).

Fisher props que se fizessem grupos de parcelas

homogneas (blocos), os quais receberiam, cada um, uma repetio de


cada tratamento.

Esse delineamento foi denominado blocos completos

casualizados, caracterizando-se pelo aparecimento de todos os tratamentos


em cada bloco. A partir da, principalmente em experimentao de campo,
o delineamento em blocos casualizados tornou-se o mais utilizado, tendo
em vista que, frequentemente, as condies ambientais sob as quais os
experimentos so implantados so heterogneas.
A eficincia do DBC depende da uniformidade dentro de cada bloco
podendo, entretanto, haver heterogeneidade entre os mesmos. Segundo
Gusmo (1986 citado por DUARTE, 2000), trs so os aspectos necessrios
para se usufruir das vantagens do uso do controle local e permitir testes

41

de hipteses corretos: homogeneidade dentro dos blocos, heterogeneidade


entre blocos e nenhuma interao entre tratamentos e blocos.
No DBC, os blocos representam uma restrio na aleatorizo, de
modo que os tratamentos so aleatoriamente designados s unidades dentro
de cada bloco.
Conforme afirmam Banzatto e Kronka (2006), a principal
vantagem deste delineamento o controle entre as diferenas que ocorrem
nas condies experimentais, de um bloco para outro, alm da obteno de
uma estimativa mais exata para a varincia residual, uma vez que a variao
ambiental entre blocos isolada.
Em relao aos outros delineamentos, segundo estes mesmos
autores, o delineamento em blocos casualizados apresenta as seguintes
desvantagens:
(i ) pela utilizao do princpio do controle local, h uma reduo no
nmero de graus de liberdade do resduo;
(ii ) a exigncia de homogeneidade das parcelas dentro de cada bloco
limita o nmero de tratamentos, que no pode ser muito elevado.
O modelo estatstico deste delineamento, considerando-se um
modelo fixo, dado por
= + + + ,

(2.26)

em que
a observao do i -simo tratamento do j -simo bloco, com =
1, 2, . . . , e = 1, 2, . . . , ;
uma constante inerente a cada observao que, sob restrio de que

= 0 e
= 0, a mdia geral;
=1

=1

o efeito do i -simo tratamento;

42

o efeito relacionado ao bloco j ;


o erro aleatrio associado ij -sima observao, o qual supe-se
(0, 2 ).
Assim como no delineamento inteiramente casualizado, para
avaliar a igualdade entre as mdias dos tratamentos, as hipteses
apropriadas so
0 : 1 = 2 = . . . =

(2.27)

1 : = , para algum = ,
em que = + representa a mdia do i -simo tratamento.

Ou,

equivalentemente,
0 : 1 = . . . = = 0
1 : = 0, para algum .
Entretanto,

conforme afirma Montgomery (2008),

(2.28)

em um

delineamento em blocos casualizados possvel ainda avaliar os efeitos dos


blocos por meio das seguintes hipteses:
0 : 1 = . . . = = 0
1 : = 0, para algum .

(2.29)

Assim como no DIC, o procedimento adequado para testar a


igualdade das t mdias dos tratamentos e a igualdade entre as r mdias dos
blocos a anlise de varincia. Denotando como a soma das observaes
do j -simo bloco e como a mdia das observaes do j -simo bloco, de
acordo com Banzatto e Kronka (2006), a anlise de varincia de um DBC
com t tratamentos e r blocos dada conforme a Tabela 2,

43
Tabela 2

Anlise de varincia para um delineamento em blocos casualizados.

FV

GL

SQ

QM

Blocos

(r -1)

SQB

Tratamento

(t-1)

SQTrat

Resduo

(t-1)(r -1)

SQRes

Total

(tr -1)

SQT

QMB =

r1

QMTrat =
t1

QMRes =
t(r1)

em que:

1 2 2

,
=

1 2
2
=
,

=1

=1 =1

=1 =1

=1

=1

=1

1 2 1 2 2

+
= ,

2
.

De acordo com Barbin (1998), se e so efeitos fixos, as


esperanas dos quadrados mdios de tratamento e resduo da anlise
varincia da Tabela 2 so exatamente iguais s esperanas dos quadrados
mdios de um DIC, apresentadas na expresso (2.25). Segundo este autor,
a esperana do quadrado mdio dos blocos expressa por

2
[ ] = +
.
1
2

=1

(2.30)

44

2.2.4

Abordagem espacial na experimentao


Segundo Cressie (1993), a prtica de aleatorizao insuficiente

para garantir a independncia espacial dos erros, justificando-se, assim, o


uso de modelos espaciais. Dessa forma, as posies espaciais das unidades
experimentais no devem ser ignoradas, uma vez que, em anlises espaciais,
quanto mais prximas as parcelas esto, mais correlacionados so os dados
delas advindos.
Martinez (1994) argumenta que, mesmo que se cumpram os
princpios bsicos da experimentao, a correlao espacial implica em
violaes das pressuposies assumidas no modelo da anlise no espacial e,
consequentemente, em uma anlise de varincia menos precisa, ressaltando,
ainda, que a proteo dada pela aleatorizao no suficiente.
Na experimentao agropecuria comum encontrar, ainda,
experimentos nos quais feito o arranjo sistemtico das parcelas, ocasionado
pela impossibilidade de se executar o princpio de aleatorizao.

Na

ausncia do mesmo, no possvel analisar os experimentos por meio da


metodologia clssica, que supe erros independentes, uma vez que se podem
encontrar experimentos cujos modelos especificados incluem explicitamente
uma estrutura de dependncia espacial, ou seja, de erros correlacionados.
De acordo com Stroup, Baenziger e Mulitze (1994), tem-se
constatado que as anlises convencionais, frequentemente, no neutralizam
de forma adequada os efeitos da variabilidade espacial, principalmente em
experimentos com nmero elevado de tratamentos. Felizmente, avanos em
estatstica para dados espacialmente distribudos tm fornecido mtodos
alternativos que consideram e modelam essa variabilidade, podendo ser
mais eficientes nesse tipo de situao.

Segundo Duarte (2000), esses

mtodos podem ser aplicados alternativamente ou em complementaridade


aos mtodos tradicionais. Esse autor entende tambm que a dependncia
espacial no deve ser considerada uma inconvenincia estatstica, mas um
verdadeiro benefcio que pode informar sobre locais no amostrados, a partir
dos dados tomados em posies prximas aos pontos desejados, mostrando

45

a importncia de uma abordagem que leve em conta a dependncia espacial.


Nesse mesmo contexto, Cressie (1993) mostra os efeitos da
correlao espacial em problemas de estimao, predio e de delineamentos
experimentais, acrescentando que a deteco dessa estrutura de correlao
e o uso dessa informao na anlise estatstica garantem estimativas
mais eficientes dos contrastes de tratamentos.

Por outro lado, sua

desconsiderao pode impedir que diferenas reais sejam levantadas. Diante


dessas preocupaes, uma grande quantidade de mtodos tem sido proposta,
no sentido de combinar as duas abordagens, clssica e espacial.
As possibilidades geradas pela anlise geoestatstica, desde o incio,
despertaram o interesse, mas tambm a sensao de inacessibilidade a
profissinais de diversas reas. A justificativa para tal sensao est ligada
ao fato de a Geoestatstica ter uma notao prpria, sendo, muitas vezes,
considerada uma teoria complexa, adicionada ao fato dessa anlise exigir
um processo computacional intenso e, at poucos anos atrs, ainda escasso.
Journel (1987) reporta tal inacessibilidade afirmando que, durante muito
tempo, a Geoestatstica se apresentou como uma teoria difcil, um pouco
esotrica, desenvolvida do outro lado do Atlntico e acessvel apenas a
pessoas altamente treinadas, ou aquelas afortunadas o bastante para ter
acesso a algum programa computacional.
Gleeson (1997 citado por DUARTE, 2000), aps demonstrar a
necessidade da aplicao dos modelos espaciais na anlise estatstica de
experimentos agrcolas, tambm reconhece que sem um software apropriado
isto se torna realmente bastante difcil. No entanto, nos ltimos anos, com o
grande avano dos mtodos computacionais, destacando o software livre R
(R DEVELOPMENT CORE TEAM, 2012), que tem implementado vrios
pacotes que se destinam anlise espacial, a utilizao dessa abordagem
surge como uma alternativa aos pesquisadores.
No intuito de difundir a anlise geoestatstica, Journel (1987)
defende ainda que, uma vez que a teoria tenha sido desmistifica,
possvel centrar a ateno nos verdadeiros problemas que tratam de sua
implementao: como colocar uma ideia simples para funcionar.

46

Zimmerman e Harville (1991) propuseram uma abordagem na


qual feita a modelagem direta do efeito de parcela (() + ()), de
forma que as observaes podem ser consideradas coletivamente como uma
realizao parcial de um campo aleatrio.

Nessa abordagem, assume-

se que os efeitos de parcela distribuem-se de acordo com algum modelo


de correlao espacial que descreve as tendncias locais, anlogos aos
modelos de semivariograma usados em Geoestatstica. Em sntese, o modelo
busca uma estimativa da funo geral de covarincia, a qual pondera,
entre outros resultados, a soluo de quadrados mnimos generalizados
dos efeitos fixos. Dada a sua concepo, os seus propositores chamaramno de modelo linear de campo aleatrio (random field linear model
- RFLM). Porm, trata-se, essencialmente, de um modelo linear com
erros espacialmente correlacionados (STROUP; BAENZIGER; MULITZE,
1994). Sua vantagem comparativa est no fato de aplicar-se a ensaios com
dependncia espacial em todas ou quaisquer direes, em associao com os
diversos esquemas de definio dos blocos (ou nenhum).
Nesse mesmo contexto, Grondona e Cressie (1991) tambm
modelaram diretamente o efeito de dependncia espacial entre os erros,
baseando suas anlises na estimao de quadrados mnimos generalizados.
Nesse procedimento, a matriz de covarincias dos erros, que pondera
o sistema de equaes normais, obtida diretamente do modelo de
semivarincia ajustado, o qual obtido a partir da anlise geoestatstica dos
resduos, aps a remoo dos efeitos dos fatores controlados no experimento.
Diferentemente de Grondona e Cressie (1991) e Zimmerman e
Harville (1991), que examinaram experimentos em blocos casualizados,
Hoef e Cressie (1993) analisaram experimentos simulados de acordo com
um delineamento inteiramente casualizado.

Nesse trabalho, oa autores

compararam os resultados obtidos da estimao dos efeitos dos tratamentos


por meio da ANOVA clssica, cujos erros foram considerados independentes,
com os resultados obtidos por meio de uma anlise espacial, na qual a matriz
de covarincias foi modelada por meio do semivariograma ajustado. Nesse
caso, a estimao do vetor de parmetros foi feita por meio dos mtodos

47

de quadrados mnimos generalizados, mxima verossimilhana e mxima


verossimilhana restrita.
Sendo assim, autores como Grondona e Cressie (1991), Hoef e
Cressie (1993) e Zimmerman e Harville (1991) foram unnimes em apontar
os benefcios desse tipo de abordagem, uma vez que, ao adotarem uma
abordagem espacial, encontraram uma reduo significativa da estimativa
do erro padro, ao comparar com os resultados obtidos pela anlise clssica,
na qual os erros eram supostamente independentes.
Martnez (1994) tambm chegou a essas concluses, uma vez
que, ao analisar dados simulados com o objetivo de comparar algumas
metodologias utilizadas para controlar a correlao espacial, observou que
a anlise por quadrados mnimos generalizados, utilizando o conceito de
variograma, resultou tambm em menores erros padres para as diferenas
entre as mdias dos tratamentos e que, alm disso, a utilizao dessa
abordagem corrigiu significativamente o problema de super e subestimao
dessas mdias.
Resultados similares foram obtidos tambm por Reis e Miranda
Filho (2003) que, trabalhando com um experimento instalado segundo
um delineamento em blocos casualizados, seguindo um modelo misto,
procuraram avaliar a presena de correlao espacial, bem como a influncia
da mesma nas estimativas dos parmetros e testes de hipteses relacionados.
Segundo esses autores, a adoo da anlise espacial resultou na reduo
das estimativas das varincias residuais e, consequentemente, em melhorias
nos ganhos esperados com a seleo dos tratamentos, concluindo que a
anlise espacial foi mais apropriada que a anlise que considerava erros
independentes.
Duarte e Vencovsky (2005), avaliando a eficincia da anlise
estatstica espacial na seleo de gentipos de diferentes linhagens de soja,
obtiveram resultados anlogos aos encontrados por Reis e Miranda Filho
(2003), ressaltando, ainda, que a anlise espacial resultou em um diferente
ordenamento das linhagens em relao anlise no espacial, levando a uma
seleo menos influenciada pelos efeitos da variao local.

48

Rossoni (2011) tambm efetuou uma comparao da anlise


clssica (erros independentes) com a anlise espacial, utilizando a
Geoestatstica e a ANOVA com modelo espacial autorregressivo SAR.
Diante dessa comparao, o autor concluiu que a utilizao de ferramentas
da estatstica espacial tornou a anlise mais precisa, uma vez que se observou
uma diminuio na variabilidade geral do experimento.

Alm disso, o

modelo espacial proporcionou uma reduo nos valores do AIC, ao serem


comparados com os valores obtidos pela modelagem clssica, indicando que
a considerao da dependncia espacial dos erros acarretou em um melhor
ajuste.
Por fim, ainda em defesa da anlise espacial, Campos (2011)
concluiu que a utilizao dessa anlise proporcionou uma seleo mais
eficiente das famlias do feijoeiro, comparadas s anlises tradicionais para
delineamentos em ltice e em blocos casualizados, uma vez que apresentou
estimativas de varincia do erro muito prximas da varincia simulada, alm
de uma maior acurcia seletiva, indicando maior preciso experimental.

49

MATERIAIS E MTODOS

Esta seo destina-se descrio da metodologia utilizada para a


simulao dos dados que foram analisados, a estimao de parmetros de
modelos lineares e a garantia da validade do teste F da anlise de varincia.

3.1

Simulao de dados
Para o desenvolvimento deste trabalho, os dados analisados foram

obtidos via simulao, por meio do software R (R DEVELOPMENT CORE


TEAM, 2012).
Foram propostos dois tipos configuraes de experimentos para
cada delineamento, DIC e DBC, o primeiro com um grande nmero de
parcelas e o segundo com um pequeno nmero de parcelas, como a seguir:
(i )

Experimento em DIC com 15 tratamentos e 8 repeties;

(ii )

Experimento em DIC com 6 tratamentos e 5 repeties;

(iii ) Experimento em DBC com 15 tratamentos e 8 blocos;


(iv )

Experimento em DBC com 6 tratamentos e 5 blocos.


O objetivo de estabelecer tais configuraes foi verificar se,

mesmo em experimentos com pequeno nmeros de parcelas, a abordagem


geoestatstica consegue captar a dependncia espacial existente entre os
erros.
No processo de simulao, os conjuntos de dados foram gerados
inicialmente fixando-se os valores dos parmetros, considerando-se modelos
fixo. Nas Tabelas 3, 4, 5 e 6 so apresentados os valores da constante e efeitos
de tratamentos e blocos, de acordo com cada configurao de experimento
citada anteriormente.

50
Tabela 3

Valores fixos dos parmetros para os experimentos em DIC com 15


tratamentos e 8 repeties.

Parmetro
Valor fixo

10

1
7

2
10

3
5

Parmetro
Valor fixo

Tabela 4

6
10

12
7

13
6

7
9

14
6

8
5

9
10

10
6

11
7

15
9

10

1
6

2
4,5

3
9

4
6,5

5
8

6
6,5

Valores fixos dos parmetros para os experimentos em DBC com 15


tratamentos e 8 repeties.

Parmetro
Valor fixo

10

Parmetro
Valor fixo

12
5,5

Tabela 6

5
8

Valores fixos dos parmetros para os experimentos em DIC com 6


tratamentos e 5 repeties.

Parmetro
Valor fixo

Tabela 5

4
5

1
4
13
7

2
6

3
8

14
6

4
9,5
15
4

5
5
1
12

6
7
2
8

7
6
3
6

8
10
4
9

9
8,5
5
9

6
10

10
4
7
5

11
9
8
7,5

Valores fixos dos parmetros para os experimentos em DBC com 6


tratamentos e 5 repeties.

Parmetro
Valor fixo

10

1
5,5

2
7

3
5,5

4
9,5

5
4

6
6

1
12

2
8

3
9,5

4
10

5
6

A esses valores fixos foi adicionado um erro aleatrio com estrutura


de dependncia espacial definida, gerado por meio da funo GaussRF
do pacote Random Fields (SCHLATHER, 2012).

Esses erros foram

simulados com mdia zero e modelos de covarincia esfrico e exponencial.


Com o objetivo de verificar a relao entre a eficincia da anlise
geoestatstica e as configuraes de dependncia espacial, foram geradas

51

diferentes combinaes de valores dos parmetros do semivariograma.


Essas configuraes so apresentadas na Tabela 7. Vale ressaltar que as
configuraes para os experimentos em DIC e DBC, com o mesmo nmero
de observaes, so exatamente as mesmas.
Os valores do efeito pepita e patamar foram gerados de forma que
os erros tenham forte e moderado grau de dependncia, conforme definido
na seo 2.1.2. J os valores do alcance foram prospotos no intuito de avaliar
a dependncia espacial de curto, mdio e longo alcance.
Tabela 7

Valores dos parmetros do semivariograma utilizados para simular o


erro experimental.

Experimento (i)
efeito pepita patamar alcance
0,10
2,5
3
0,10
2,5
6
0,10
2,5
9
0,75
2,5
3
0,75
2,5
6
0,75
2,5
9

Experimento (ii)
efeito pepita patamar alcance
0,10
2,5
2
0,10
2,5
4
0,10
2,5
6
0,75
2,5
2
0,75
2,5
4
0,75
2,5
6

Os dados foram simulados de acordo com um grid regular, em que


a distncia entre os centroides das parcelas adjacentes foi definida como 1
u.m (unidade de medida). Em todo o processo de simulao, o erro foi
considerado uma varivel isotrpica, isto , a dependncia entre os erros
varia de acordo com a distncia que os separa, apresentando o mesmo
comportamento espacial em todas as direes. Nas Figuras 1 e 2 esto
apresentados os grids utilizados na simulao dos experimentos em DIC
para as duas configuraes propostas, de modo que representa o efeito
do tratamento i adicionado unidade experimental correspondente.
Na anlise geoestatstica, a aleatorizao no um princpio
obrigatrio e, por isso, foi realizado um arranjo sistemtico dos tratamentos
nas unidades experimentais, sem utilizao de qualquer critrio de
aleatorizao.

52

Figura 1

Grid de um experimento em DIC, com 15 tratamentos e 8 repeties

Figura 2

Grid de um experimento em DIC, com 6 tratamentos e 5 repeties

53

J o grid utilizado na simulao dos experimentos em DBC com


15 tratamentos e 8 blocos apresentados na Figura 3, enquanto na Figura 4
apresenta-se o croqui da simulao dos experimentos com 6 tratamentos
e 5 blocos, especificando, alm das coordenadas espaciais, os efeitos de
tratamentos e blocos correspondentes a cada unidade experimental.

Figura 3

Grid de um experimento em DBC, com 15 tratamentos e 8 blocos

54

Figura 4

3.2

Grid de um experimento em DBC, com 6 tratamentos e 5 blocos

Estimao de parmetros
Um modelo linear, de forma geral, pode ser representado por:
= X + ,

(3.1)

em que
o vetor de observaes de ordem n 1;
X a matriz de incidncia dos paramtros do modelo de ordem n , em
que p o nmero de parmetros presentes no modelo;
o vetor de paramtros do modelo de ordem 1;
o vetor de erros aleatrios de ordem n 1, sendo que, frequentemente,
assume-se que (0 , I 2 ).
Neste trabalho, os estimadores dos parmetros do modelo
considerando-se erros espacialmente dependentes foram obtidos pelos
mtodos de quadrados mnimos generalizados e mxima verossimilhana.
Entretanto, para a obteno das somas de quadrados da anlise de
varincia, por meio da reduo de modelos, foi necessrio obter estimadores
dos parmetros de acordo com os modelos particionados.
Segundo Searle (1987), convenientemente, um modelo linear pode

55

ser escrito de forma particionada.

O modelo particionado para um

delineamento inteiramente casualizado dado por


= X1 + X2 + ,

(3.2)

em que Y o vetor de observaes, uma constante inerente a cada


observao, e um vetor 1 que contm os efeitos de tratamento, X1
um vetor de uns, X2 a matriz de incidncia dos efeitos de tratamento de
.
.
ordem , de tal modo que X = [ X .. X ] e = [ .. ] e, por fim,
1

representa um vetor de erros.


Desse modo, o modelo de um DIC com t = 3 tratamentos e r = 2
repeties pode ser representado, matricialmente, por

11

12

21

22

31

32

1 1 0 0

1 1 0 0

1 0 1 0

1 0 1 0

1 0 0 1

1
+

1 0 0 1

11

12

21

;
22

31

32

ou, equivalentemente, de forma particionada,

11

12

21

22

31

32

1 0 0

11

12
1 0 0
1

0 1 0

21
2 +
22
0 1 0
3


0 0 1
31
0 0 1
32

Em um processo anlogo, o modelo para um experimento em blocos


casualizados pode ser particionado da seguinte forma:
= X1 + X2 + X3 + ,

(3.3)

56

sendo Y o vetor de observaes, uma constante inerente a cada


observao, um vetor 1 que contm os efeitos de tratamento,
um vetor 1 contendo os efeitos de bloco, X1 um vetor de uns, X2
a matriz de incidncia dos efeitos de tratamento de ordem , X3 a
matriz de incidncia dos efeitos de bloco de ordem , de tal modo que
.
.
.
.
X = [ X1 .. X2 .. X3 ] e = [ .. .. ] e, por fim, representa um vetor
de erros.
Como forma de ilustrao, o modelo de um DBC com t = 3
tratamentos e r = 2 blocos dado por

11

12

21

22

31

32

1 1 0 0 1 0

1 1 0 0 0 1

1 0 1 0 1 0

1 0 1 0 0 1

1 0 0 1 1 0

1 0 0 1 0 1

11

12

21

;
22

31

32

ou, por meio de sua forma particionada,

11

12

21

22

31

32

3.3

1 0 0

1 0

0 1
1 0 0
1

0 1 0

1 0
2 +
0 1
0 1 0
3

1 0
0 0 1

0 0 1
0 1

11

[
] 12


1

21
+

2
22

31
32

Modelagem geoestatstica do erro


Os dados experimentais, obtidos via simulao, foram submetidos

s anlises estatsticas relacionadas a dois modelos: o primeiro assumindo

57

que os erros so espacialmente independentes e o segundo considerando a


estrutura de dependncia espacial entre os erros. Dessa forma, as seguintes
estruturas da matriz de covarincias dos erros foram consideradas:
i.

= I 2 (modelo com erros independentes);

ii.

= I 2 +F2 = V 2 (modelo com erros espacialmente dependentes),

de modo que 2 = 2 + 2 corresponde ao patamar do semivariograma.


A modelagem geoestatstica do erro consiste, primeiramente, em
obter o vetor de erros estimados ^, a partir do modelo que supe
independncia entre os mesmos. Esses erros representam a diferena entre os
valores observados e os estimados, podendo ser calculados, matricialmente,
por: ^ = X0 , em que 0 = (X X) X .
A partir da estimao de ^, possvel verificar se existe ou
no dependncia entre os erros. Essa verificao foi realizada por meio
da prpria anlise do semivariograma.

Segundo Journel (1989), se os

valores de semivarincia distriburem-se de forma aleatria em funo das


distncias, significa que os erros so independentes.

No entanto, se o

semivariograma apresentar uma estrutura de dependncia espacial, na qual


os valores de semivarincia aumentam com o aumento dos valores de h
at uma determinada distncia (), pode-se concluir que os erros possuem
dependncia espacial.
Como mtodo auxiliar na anlise do semivariograma, pode-se,
ainda, construir envelopes, os quais so obtidos por meio da permutao
dos valores observados nas posies espaciais. Se o envelope contiver todos
os pontos do semivariograma, significa que os valores de semivarincia
distribuem-se de forma aleatria e, com isso, pode-se concluir que os
erros so independentes. Entretanto, se algum valor de semivarincia no
estiver dentro do envelope, considera-se que o semivariograma apresenta
uma estrutura de dependncia espacial definida e, por isso, os erros so
considerados dependentes espacialmente.
Uma vez detectada a estrutura de dependncia espacial, a prxima
etapa da modelagem da variabilidade espacial do erro consiste em ajustar

58

um modelo terico ao semivariograma, sendo que, neste trabalho, foram


ajustados apenas o modelo esfrico e o exponencial, de acordo com o modelo
utilizado no processo de simulao. Como o erro uma varivel isotrpica,
assim definido na simulao, construiu-se o semivariograma omnidirecional,
de forma que, para o clculo de suas semivarincias, foram consideradas
apenas as distncias, em qualquer direo, entre dois pontos amostrados. O
mtodo utilizado para ajustar os modelos tericos ao semivariograma foi o
de quadrados mnimos ordinrios.
A partir do ajuste do modelo terico de semivariograma possvel,
ento, obter a matriz de covarincia dos erros, que dada por

( 1 , 2 ) ( 1 , )

(2 )
( 2 , )
( 2 , 1 )
=
.
.
..
..

..
..
.
.

( , 1 ) ( , ) ( )

(1 )

e, conforme apresentado na seo (2.1.4), assumindo que o erro uma


varivel estacionria de segunda ordem, essa matriz corresponde a

( 12 )
=
..

( 1 )

( 12 ) ( 1 )
2
..
.
( 2 )

( 2 )
;
..
..

.
.

de modo que a distncia entre os erros e , respectivamente alocados


nas posies e , ou seja, = .
Por meio das relaes () = (0) () e () =
(0) = 2 , possvel reescrever como

()
, em que
(0)

59

V 2

( 12 )
=
..

( 1 )

( 12 ) ( 1 )
1
..
.
( 2 )

( 2 )
2;
..
..

.
.

em que V conhecida como uma matriz de correlao.


Os modelos tericos de correlao esfrico e exponencial so dados
por
Modelo esfrico:

() =

2 + 2

1
, = 0;
( )
( )3 ]

1 1, 5
+ 0, 5
, 0 < < ;

(3.4)

, .

Modelo exponencial:

() =

1
, = 0;
[
(
)]
2
3

exp
, =
0.
2 + 2

(3.5)

De posse da matriz V, possvel obter o vetor de parmetros


estimados, considerando-se a dependncia espacial dos erros que, conforme
afirma Graybill (1976), dado por
0 = (X V1 X) X V1 .

(3.6)

A fim de encontrar uma maior eficincia dos resultados, Pontes


(2002) sugeriu um algoritmo no qual eram realizadas iteraes at que a
mdia dos erros padro dos valores preditos atingisse convergncia.

60

No processo iterativo desse algoritmo, a partir do vetor 0 , obtmse uma nova estimativa para o vetor de erros, de modo que ^* =
X0 . No intuito de encontrar uma maior eficincia dos resultados, um novo
semivariograma deve ser construdo, com base na varivel aleatria ^* . A
esse semivariograma, novamente, ajusta-se um modelo terico e obtm-se
novas estimativas para os seus parmetros. Com essas estimativas possvel
construir novamente a matriz de covarincia dos erros , a qual utilizada
para obter um novo vetor de parmetos 0 . Pontes (2002) assumiu como
critrio de estabilizao a convergncia dos valores mdios dos erros padro
dos valores preditos.
Neste trabalho, esse processo foi repetido at que as estimativas
dos parmetros do semivariograma se estabilizassem e, cosequentemente,
ocorresse a estabilizao de todo o processo, sendo considerada uma
tolerncia de 104 . Os parmetros encontrados na ltima iterao foram,
ento, utilizados para calcular a matriz de covarincia dos erros (), a qual
assumiu um papel fundamental na obteno das somas de quadrados da
anlise de varincia.
importante ressaltar que, durante o processo de modelagem
da variabilidade espacial do erros, todas as anlises geoestatsticas foram
realizadas com o auxlio do pacote geoR (RIBEIRO JNIOR; DIGGLE,
2001), implementado no software R (R DEVELOPMENT CORE TEAM,
2012).

3.4

O teste F da anlise de varincia


Na teoria de probabilidade e estatstica, a distribuio F de

Snedecor uma distribuio de probabilidade contnua que, frequentemente,


utilizada como a distribuio nula de uma estatstica de teste que, em
especial, empregada na anlise de varincia.
Um dos objetivos deste trabalho foi demonstrar a validade do teste
F da anlise de varincia que considera a informao espacial sobre os erros.

61

Para isso, foi necessrio mostrar que a estatstica 0 deste teste vem de uma
distribuio F de Snedecor.
Segundo Mood, Graybill e Boes (1974), uma varivel aleatria
com distribuio F dada pela razo entre duas variveis aleatrias com
distribuio qui-quadrado (2 ), divididas por seus respectivos graus de
liberdade. Desse modo, considerando U uma varivel aleatria que segue
uma distribuio qui-quadrado com m graus de liberdade e V outra varivel
aleatria que tem distribuio qui-quadrado com n graus de liberdade, de
tal forma que U e V sejam independentes, possvel afirmar que a varivel
aleatria
=

/
/

(3.7)

tem distribuio F central com m e n graus de liberdade.


Porm, conforme afirma Graybill (1976), se U uma varivel
aleatria que tem distribuio qui-quadrado no central com m graus de
liberdade e parmetro de no centralidade e V uma outra varivel
aleatria que tem distribuio qui-quadrado central com n graus de
liberdade, ou seja, 2(, ) e 2() , de forma que U e V so
independentes, ento, a varivel aleatria W, definida na equao (3.7), tem
uma distribuio F no central com m e n graus de liberdade e parmetro
de no centralidade .
Na anlise de varincia, se os erros forem independentes e
normalmente distribudos com uma varincia comum, a estatstica 0 ,
obtida pela razo de quadrados mdios, segue uma ditribuio F.
Por isso, para mostrar que o teste F continua sendo vlido quando
as somas de quadrados da anlise varincia so ponderadas por uma matriz
V, em que V modela a correlao entre os erros, deve-se mostrar que

2(, )
2

2() ,
2

(3.8)

em que SQtrat e SQRes representam, respectivamente, as soma de

62

quadrados de tratamentos e de resduos. Alm disso, 2 refere-se varincia


do erro, r e k representam, respectivamente, os graus de liberdade do
tratamento e do resduo e um parmetro de no centralidade.
Dessa forma, se / 2 e / 2 so independentes, ento

0 =


(/ 2 )/
=
(, ; ),

(/ 2 )/

(3.9)

sendo que QMtrat e QMRes referem-se, respectivamente, ao quadrado


mdio de tratamento e ao quadrado mdio do resduo.
Em um processo anlogo, possvel mostrar a aplicabilidade do
teste F na avaliao da igualdade entre as mdias dos blocos.

63

RESULTADOS E DISCUSSES

Esta seo aborda, inicialmente, a construo e a utilizao


da anlise de varincia para experimentos cujos erros so espacialmente
correlacionados.

Posteriormente, foram realizadas anlises referentes s

simulaes formuladas sob diferentes configuraes espaciais. Por fim, um


exemplo de aplicao foi apresentado, para uma melhor compreenso de
como obter a anlise de varincia pela abordagem espacial.

4.1

Estimao de parmetros considerando = V 2


Um modelo linear com erros espacialmente correlacionados pode

ser representado da seguinte forma:


= X + ,

com

(0 , ),

(4.1)

em que = V 2 , de modo que V a matriz de correlao dos erros


apresentada na seo (3.3).
Um dos mtodos utilizados para a estimao de parmetros o
mtodo de mxima verossimilhana. De acordo com o modelo apresentado
na expresso (4.1), para estimar o vetor de parmetros por meio
deste mtodo preciso assumir que segue alguma distribuio, sendo
que, geralmente, assume-se que tem distribuio normal multivariada.
Segundo Rencher e Schaalje (2008), ao supor que (X, ), a funo
de verossimilhana dada pela densidade de probabilidade de , ou seja,

1
1
(, ) = ( ) = (2) 2 | | 2 exp[ ( X) 1 ( X)], (4.2)
2

em que n corresponde ao nmero de observaes de Y.

64

A maximizao da funo de verossimilhana equivale


maximizao do logaritmo neperiano dessa funo. Alm disso, segundo
Rencher et al. (2008), se c uma constante e A uma matriz quadrada
de ordem n, ento | A |= | A |. Desse modo, considerando-se que
= V 2 , em que V uma matriz simtrica positiva definida conhecida e
que o logaritmo neperiano da funo de verossimilhana dado por

1
ln (, 2 ) = ln(2) ln(| V |) ln( 2 ) 2 ( X) V1 ( X),
2
2
2
2
tem-se que os estimadores de mxima verossimilhana para e 2 so dados
por
ln (, 2 )
= 2X V1 + 2X V1 X0 = 0,

0 = (X V1 X) X V1 .

(4.3)

ln (, 2 )

1
= 2 +
( X0 ) V1 ( X0 ) = 0,
2

2^

2(^
2 )2

^2 =

( X0 ) V1 ( X0 )
.

(4.4)

Segundo Graybill (1976), um outro mtodo para se obter um


estimador para atravs do mtodo de quadrados mnimos generalizados.
A partir desse mtodo, necessrio considerar que L uma matriz quadrada
de ordem n no singular, de modo que V1 = LL . Pr-multiplicando o
modelo (4.1) por L e definindo = L , Z = L X e = L tem-se um
novo modelo que dado por
= Z + ;
de modo que

(4.5)

65

[] = [L ] = L [] = 0,
[] = [L ] = L []L = (L1 L)L VL 2 = L1 (LL )VL 2 ,
[] = I 2 .
Com isso, tem-se que (0, I 2 ) e, desse modo, o vetor de
parmetros pode ser estimado por
0 = (Z Z) Z ,

(4.6)

que, substituindo = L e Z = L X , equivale a


0 = (X V1 X) X V1 ;

(4.7)

que exatamente o mesmo estimador encontrado atravs do mtodo de


mxima verossimilhana.

4.2

Delineamento inteiramente casualizado (DIC)


Nesta seo foram apresentados os estimadores de parmetros,

por meio de modelos particionados, para um delineamento inteiramente


casualizado com erros espacialmente correlacionados, bem como sua anlise
de varincia com as respectivas esperanas de seus quadrados mdios e, por
fim, foram ainda apresentadas as distribuies de probabilidade associadas
a esses quadrados mdios.
4.2.1

Estimao de parmetros via modelos particionados


Como j foi dito anteriormente, para a obteno da anlise

de varincia por meio de formas quadrticas, necessria a estimao


dos parmetros por meio de modelos particionados.

Devido s suas

propriedades, foi utilizada a inversa generalizada de Moore-Penrose.

66

Entretanto, antes de definir esses estimadores, necessrio apresentar


algumas propriedades dessa inversa generalizada, a qual denotada pelo
expoente (+):
[.1] : AA+ A = A;
[.2] : A+ AA+ = A+ ;
[.3] : (AA+ ) = AA+ ;
[.4] : AA+ = A(A A)+ A ;
[.5] : (A )+ = (A+ ) ;
Conforme visto na seo (3.2), convenientemente, o modelo da
.
equao (4.1) pode ser particionado de forma que X = [ X1 .. X2 ] e
.
= [ .. ]. Com isso, o modelo transformado da expresso (4.5) ter
a seguinte partio:
= Z1 + Z2 + ,

(4.8)

.
com Z = [ Z1 .. Z2 ], de forma que Z1 = L X1 e Z2 = L X2 .
Os estimadores dos parmetros e foram obtidos a partir do
sistema de equaes normais (S.E.N) do modelo (4.5):
(Z Z)0 = Z ,
[

Z1

Z2
[

Z1 Z2

Z1 Z1 Z1 Z2

] [

Z2 Z1 Z2 Z2
{

0
0
0

[
=

[
=

Z1
Z2

Z1
Z2

]
,
]
,

Z1 Z1 0 + Z1 Z2 0 = Z1 ,

(I)

Z2 Z1 0

(II)

Z2 Z2 0

Z2 .

Prmultiplicando-se a equao (I) por Z2 Z+


1 e lembrando que,

67

dadas duas matrizes A e B, (AB) = B A , tem-se que


+
+

0
0
Z2 Z+
1 Z1 Z1 + Z2 Z1 Z1 Z2 = Z2 Z1 Z1 ;
+
+
0

Z2 Z1 Z+
1 Z1 + Z2 Z1 Z1 Z2 = Z2 Z1 Z1 ;
+
0

Z2 Z1 0 + Z2 Z1 Z+
1 Z2 = Z2 Z1 Z1 .

(III)

Subtraindo-se a equao (III) de (II) encontra-se um estimador


para que dado por
{

Z2 Z1 0 + Z2 Z2 0 = Z2 ,
+

0
Z2 Z1 0 Z2 Z1 Z+
1 Z2 = Z2 Z1 Z1 ,

+
0

Z2 (I Z1 Z+
1 )Z2 = Z2 ( Z1 Z1 ) ;

0 = (Z2 RZ2 ) Z2 R,
com R = I Z1 (Z1 Z1 )1 Z1 .
Para encontrar um estimador para , basta substituir 0 na
equao (I),
0 = (Z1 Z1 )1 Z1 (Z1 Z1 )1 Z1 Z2 0 ;
0 = (Z1 Z1 )1 Z1 Q,
em que Q = I Z2 (Z2 RZ2 ) Z2 R.
Por fim, substituindo-se Z1 = L X1 , Z2 = L X2 , = L e
V1 = LL , encontra-se que os estimadores para e referentes ao modelo
particionado, cujos erros so espacialmente correlacionados, so dados por
0 = (X2 RV X2 ) X2 RV ,

(4.9)

0 = (X1 V1 X1 )1 X1 QV ,

(4.10)

de modo que RV = V1 V1 X1 (X1 V1 X1 )1 X1 V1

68

QV = V1 V1 X2 (X2 RV X2 ) X2 RV .

4.2.2

Anlise de varincia
De acordo com o modelo transformado = Z + , de modo

que (0, I 2 ), a soma de quadrados do erro dada por = (


Z) ( Z). Substituindo-se = L , Z = L X, = L e V1 = LL ,
tem-se que:
= V1 = ( X) V1 ( X),
= V1 2 X V1 + X V1 X.
Do sistema de equaes normais tem-se que X V1 X0 =
X V1 .

Desse modo, substituindo-se por 0 , obtm-se a soma de

quadrados de resduos que dada por


= V1 20 X V1 + 0 X V1 ,
= V1 0 X V1 ,
= ^
.
De maneira anloga, possvel obter a soma de quadrados referente
mdia, comumente conhecida como correo para a mdia, que dada por
= 0 Z1 = Z1 (Z1 Z1 )1 Z1 ,
= 0 X1 V1 = V1 X1 (X1 V1 X1 )1 X1 V1 .
Por fim, para obter a anlise de varincia para um delineamento
inteiramente casualizado com erros espacialmente correlacionados,
necessrio definir a soma de quadrados total (SQT ) e a soma de quadrados
de tratamentos (SQTrat), que so dadas por
= ^
= 0 X V1 0 X1 V1 ;

69

= = V1 0 X1 V1 .
Na Tabela 8 apresentado o esquema desta anlise de varincia,
de forma que r (A) denota o posto de uma matriz A.
Tabela 8

Anlise de varincia de um DIC, considerando erros correlacionados


espacialmente.

FV
Tratamento

GL
(X) (X1 )

Resduo

(V1 ) (X)

V1 0 X V1

Total

(V1 ) (X1 )

V1 0 X1 V1

0 X V1

SQ
0 X1 V1

Entretanto, ao substituir os estimadores 0 e 0 pelas suas


expresses matriciais, as somas de quadrados desta anlise de varincia
podem ser definidas por meio de formas quadrticas, conforme apresentado
na Tabela 9,
V

sendo P

V1 X(X V1 X) X V1

P1

X1 (X1 V1 X1 )1 X1 V1 .

Tabela 9

Anlise de varincia de um DIC, considerando = V 2 , por meio de


formas quadrticas.

FV
Tratamento
Resduo
Total

GL
(X) (X1 )
1

(V

) (X)

(V1 ) (X1 )

(P

SQ
P1 )

(V1 P)
(V1 P1 )

Um outro mtodo para se obter a anlise de varincia por meio da


reduo de modelos. Segundo Searle (1987), o modelo definido na equao
(4.8) apresenta as seguintes redues:

70

(I)
(II)

= Z1 + ;
= Z1 + Z2 + ;

sendo o estimador de para o modelo (I) dado por 0 = (Z1 Z1 )1 Z1 .


Conforme visto em (4.1.1), os estimadores para e , considerando o modelo
(II), so definidos como
0
0 = (Z1 Z1 )1 Z1 Q e
= (Z2 RZ2 ) Z2 R,

em que Q = I Z2 (Z2 RZ2 ) Z2 R e R = I Z1 (Z1 Z1 )1 Z1 .


De acordo com Searle (1987), as somas de quadrados referentes aos
modelos reduzidos so dadas por
() = ^
= 0 Z1 = Z1 (Z1 Z1 )1 Z1 ,
0 Z ,
(, ) = ^
= 0 Z1 +
2

(, ) = Q Z1 (Z1 Z1 )1 Z1 + RZ2 (Z2 RZ2 ) Z2 ,


(, ) = Z1 (Z1 Z1 )1 Z1 + RZ2 (Z2 RZ2 ) Z2 R
(|) = (, ) () = RZ2 (Z2 RZ2 ) Z2 R.
Segundo este autor, a anlise de varincia para um delineamento
inteiramente casualizado, por meio das somas de quadrados obtidas por
modelos reduzidos, dada conforme a Tabela 10.
Tabela 10

Somas de quadrados da anlise de varincia de um DIC, obtidas por


meio de modelos reduzidos.

FV
Mdia

GL
(X1 )

SQ
()

Tratamento

(X) (X1 )

(|) = (, ) ()

Resduo

(I() ) (X)

(, )

Total

(I() )

71

Ao substituir Z1 = L X1 , Z2 = L X2 , = L e V1 = LL , as
somas de quadrados desta anlise de varincia so dadas por
= V1 V1 X1 (X1 V1 X1 )1 X1 V1 = RV ;
= RV X2 (X2 RV X2 ) X2 RV ;
= = [RV RV X2 (X2 RV X2 ) X2 RV ] ;
em que RV = V1 P1 = V1 V1 X1 (X1 V1 X1 )1 X1 V1 .

4.2.3

Esperanas dos quadrados mdios


Conforme visto na seo (2.2.2), o modelo estatstico de um

delineamento inteiramente casualizado representado por


= + + ,

com

= 1, 2, . . . , e = 1, 2, . . . , .

(4.11)

De acordo com este modelo, os somas de quadrados de tratamento


e resduos so dadas da seguinte maneira:


1 2
1 2 2
2

e =

;
=

=1

=1 =1

=1

cujos respectivos quadrados mdios so


=

e =
.
1
( 1)

Considerando que [ ] = 0, [ ] = 2 , [ , ] =
[ ] = 0 para algum = e definindo
=

>

2( , ), =


>

2( , ) e

72

2( , ),

>

as esperanas desses quadrados mdios podem ser estabelecidas conforme a


Tabela 11.
De acordo com essa tabela, mesmo que a hiptese nula (0 ) de
que = 0 seja verdadeira, [ ] = [ ] e, com isso, o teste
F da anlise de varincia no adequado para comparar as varincias. Por
este motivo, se os erros forem correlacionados, para que [ ] =
[ ], sob 0 , necessrio que essa correlao seja considerada como
uma ponderadora das somas de quadrados.
Tabela 11

Esperana dos quadrados mdios de um DIC com


correlacionados, a partir das somas de quadrados clssicas.

FV
Tratamento

erros

E[QM]
1
2
1

( + )
+
+
1

( 1)

Resduo

( 1)

Na anlise de varincia apresentada na Tabela 9 so definidas as


somas de quadrados ponderadas pela matriz de correlao V, representadas
por meio de formas quadrticas. Segundo Searle (1971), se um vetor
aleatrio com mdia X e varincia e A uma matriz simtrica de
constantes, ento,
[ A ] = (A) + X AX.

(4.12)

Desse modo, a esperana da soma de quadrados de resduos dada


por
[] = [ V1 ] [ P ],

73

de modo que P = V1 X(X V1 X) X V1 .


Entretanto, para os clculos das somas de quadrados, considerase que (X V1 X) uma inversa generalizada de Moore-Penrose, isto ,
(X V1 X)+ . Alm disso, necessrio apresentar algumas propriedades
sobre trao e posto (rank ) de matrizes:
[.1] : (AB) = (BA);
[.2] : (A B) = (A) (B);
[.3] : (A) = (A), se A idempotente;
[.4] : (A A) = (AA ) = (A);
[.5] : (A+ A) = (AA+ ) = (A)
[.6] : Se B no singular de ordem m e A uma matriz , ento
(BA) = (A).
De acordo com essas propriedades, tem-se que
(PV) = (V1 X(X V1 X)+ X ) = (X V1 X(X V1 X)+ ),
(PV) = (X V1 X(X V1 X)+ ) = (X V1 X) = ((L X) (L X)),
(PV) = (L X) = (X).
Com isso, a [] e, consequentemente, [ ] so dadas
por
[] = (V1 V 2 ) + X V1 X (PV 2 ) X PX;
[] = 2 ((X))+ X V1 X X V1 X(X V1 X)+ X V1 X;
[] = 2 ( (X));
[
]

2 ( (X))
[ ] =
=
= 2.
(X)
(V1 ) (X)
De maneira anloga, possvel encontrar a esperana da soma de
quadrados de tratamento, de forma que

74

[ ] = [ P ] [ P1 ],
em que P1 = V1 X1 (X1 V1 X1 )1 X1 V1 .
[ ] = 2 (X) + X V1 X 2 (P1 V) X P1 X;
[ ] = 2 ((X) 1) + X V1 X X P1 X;

(*)
(*) = ( X1 + X2 )V1 (X1 + X2 ) ( X1 + X2 )P1 (X1 + X2 );
(*)

2 X1 V1 X1

X2 V1 X2

(X1 V1 X1 )(X1 V1 X1 )1 X1 V1 X2

+X1 V1 X2 + X2 V1 X1 2 (X1 V1 X1 )(X1 V1 X1 )1 (X1 V1 X1 )


X2 V1 X1 (X1 V1 X1 )1 (X1 V1 X1 ) X2 P1 X2 ;
(*) = X2 (V1 P1 )X2 .
Desse modo, a esperana do quadrado mdio do tratamento dada
por
[
[ ] =

]

1
=
[ ];
(X) 1
(X) 1

[ ] = 2 +

1
X2 (V1 P1 )X2 .
(X) 1

Sob hiptese nula verdadeira, ou seja, se = 0, ento,


[ ] = [ ] e, com isso, a estatstica F0 da anlise de
varincia a razo entre dois estimadores no tendenciosos para 2 . Todos
os clculos efetuados nesta seo esto sintetizados na Tabela 12.

75
Tabela 12 Esperana dos quadrados mdios de um DIC considerando erros
espacialmente correlacionados.

FV
Tratamento

E[QM]
1
2 +
X2 (V1 P1 )X2
(X) 1

Resduo

4.2.4

Aplicabilidade do teste F
O teste F da anlise de varincia surge pela considerao da

decomposio da variabilidade de um conjunto de dados em termos de


somas de quadrados. Por meio deste teste possvel realizar inferncias
sobre a hiptese de igualdade entre vrias mdias dos nveis de algum fator
de interesse.
Segundo Banzatto e Kronka (2006), para garantir a validade
do teste F da anlise de varincia, necessrio que os erros sejam
homocedsticos, independentes e normalmente distribudos.

Porm, a

anlise de varincia apresentada na seo (4.1.2) parte do princpio de que


os erros so espacialmente dependentes e, por isso, surge a necessidade de
verificar se o teste F continua sendo vlido nesta anlise de varincia.
De acordo com Rencher e Schaalje (2008), dado um vetor
(X, ) e A() uma matriz real e simtrica de posto k, uma condio
1
necessria e suficiente para A 2(,) , em que = X AX o
2
parmetro de no centralidade, que A seja idempotente.
Conforme visto anteriormente, se (X, ), em que =
V 2 ,

ento a soma de quadrados de resduos dada por


= [V1 V1 X(X V1 X)+ X V1 ].
Substituindo V1 = 2 1 , tem-se que

= [ 2 1 2 1 X(X 2 1 X)+ X 2 1 ] ;

76

= [1 1 X(X 1 X)+ X 1 ].
2
Desse modo, definindo A = 1 1 X(X 1 X)+ X 1 ,
preciso mostrar que A idempotente:
AA = [1 1 X(X 1 X)+ X 1 ][1 1 X(X 1 X)+ X 1 ],
AA = [1 1 X(X 1 X)+ X 1 ][I X(X 1 X)+ X 1 ],
AA = [1 1 X(X 1 X)+ X 1 ] = A.

Logo, A idempotente e, por isso, / 2 2 com graus


de liberdade dado pelo posto de A, que calculado como
(A) = (1 1 X(X 1 X)+ X 1 ) = (I 1 X(X 1 X)+ X );
(A) = (I 1 X(X 1 X)+ X ) = ().
Alm disso, o parmetro de no centralidade de / 2 dado
por
1
1
= X AX = X [1 1 X(X 1 X)+ X 1 ]X,
2
2
1
= [X 1 X X 1 X(X 1 X)+ X 1 X] = 0.
2
Portanto, / 2 tem distribuio 2 central com ( (X))
graus de liberdade. Esse mesmo procedimento ser utilizado para mostrar
que / 2 2 .

= [1 X(X 1 X)+ X 1 1 X1 (X1 1 X1 )+ X1 1 ].
2
Dado B = 1 X(X 1 X)1 X 1 1 X1 (X1 1 X1 )+ X1 1 ,
necessrio mostrar que B idempotente:
BB = [1 X(X 1 X)+ X 1 X(X 1 X)+ X 1 +

77

1 X(X 1 X)+ X 1 X1 (X1 1 X1 )1 X1 1 +


1 X1 (X1 1 X1 )1 X1 1 X(X 1 X)+ X 1 +
+1 X1 (X1 1 X1 )1 X1 1 X1 (X1 1 X1 )1 X1 1 ].
Dado que X(X 1 X)+ X 1 X1 = X1 e X1 1 X(X 1 X)+ X =
X1 , encontra-se que
BB = [1 X(X 1 X)+ X 1 1 X1 (X1 1 X1 )1 X1 1 ] = B.

Logo, B idempotente e, desse modo, / 2 2 com


graus de liberdade dado pelo posto de B que
(B) = (1 X(X 1 X)+ X 1 1 X1 (X1 1 X1 )1 X1 1 ),
(B) = (1 X(X 1 X)+ X 1 X1 (X1 1 X1 )1 X1 ),
(B) = (1 X(X 1 X)+ X )(1 X1 (X1 1 X1 )1 X1 ) = ()1.
J o parmetro de no centralidade de / 2 definido como

1 1
(X X(X 1 X)+ X 1 X X 1 X1 (X1 1 X1 )1 X1 1 X),
2

1 1
X ( 1 X1 (X1 1 X1 )1 X1 1 )X,
2

1 1
1 1
X (V P1 )X =
X2 (V P1 )X2 .
2
2
2 2

Dessa forma, j que / 2 e / 2 seguem distribuies


qui-quadrado, para garantir a validade do teste F da anlise de varincia,
basta mostrar que essas duas variveis aleatrias so independentes.
Segundo Graybill (1976), dado que

(X, ) e A e B so

matrizes simtricas de ordem n, as formas quadrticas A e B


so independentes se, e somente se, AB = 0 (ou, equivalentemente,
BA = 0). Com isso, seja
A = 1 1 X(X1 X)+ X1 = 1 M;

78

B = 1 X(X1 X)+ X1 1 X1 (X1 1 X1 )1 X1 1 = M N;


AB = (1 M)(M N) = M N MM + MN.
Porm, MM e MN so dadas por:
MM = 1 X(X1 X)+ X1 X(X1 X)+ X1 ,
MM = 1 X(X1 X)+ X1 = M

MN = 1 X(X1 X)+ X1 X1 (X1 1 X1 )1 X1 1 ,


MN = 1 X1 (X1 1 X1 )1 X1 1 = N.
Sendo assim, AB = M N M + N = 0 e, dessa forma, as
variveis / 2 e / 2 so independentes. Com isso, pode-se
concluir que
/((X) 1)

( / 2 )/((X) 1)
=
=
(1 , 2 ; ) ,
2
(/ )/( (X))
/( (X))

em que 1 = (X) 1, 2 = (X) e =

4.3

1
X2 (V1 P1 )X2 .
2 2

Delineamento em blocos casualizados (DBC)


Assim como para o delineamento inteiramente casualizado, alm da

anlise de varincia considerando erros espacialmente dependentes, foram


apresentadas tambm as esperanas dos seus quadrados mdios. Por fim,
foi ainda verificada a validade do teste F para o delineamento em blocos
casualizados.
4.3.1

Anlise de varincia
O modelo de um experimento instalado sob um delineamento

em blocos casualizados, cujos erros so espacialmente correlacionados,

79

definido por = X + , com (0, V 2 ). Conforme visto na seo


(3.2), este modelo pode ser convenientemente particionado como:
= X1 + X2 + X3 + .

(4.13)

Prmultiplicando-se esse modelo por uma matriz L de ordem n,


de modo que V1 = LL , obtm-se um modelo transformado, que dado
por
= Z1 + Z2 + Z3 + ,

(4.14)

em que = L , Z1 = L X1 , Z2 = L X2 , Z3 = L X3 e = L . Conforme
demonstrado na seo (4.1), (0, I 2 ).
A partir dessa partio possvel obter as somas de quadrados
da anlise de varincia por meio da abordagem de modelos reduzidos.
Conforme afirma Searle (1987), o modelo (4.14) apresenta as seguintes
redues:
(I)

= Z1 + ;

(II)

= Z1 + Z2 + ;

(III)

= Z1 + Z2 + Z3 + .

O estimador de para o modelo (I) dado por 0


(Z1 Z1 )1 Z1 ,

enquanto os estimadores para e , considerando o modelo

(II), so definidos como


0
0 = (Z1 Z1 )1 Z1 Q e
= (Z2 RZ2 ) Z2 R,

em que Q = I Z2 (Z2 RZ2 ) Z2 R e R = I Z1 (Z1 Z1 )1 Z1 .


J o modelo apresentado em (III) corresponde ao modelo completo
e, por isso

0 = 0 = (Z Z) Z ;
0

80

.
.
em que Z = [ Z1 .. Z2 .. Z3 ].
Com base nesses estimadores, visando anlise de varincia de
um delineamento em blocos casualizados, possvel encontrar as seguintes
somas de quadrados:
() = ^
= 0 Z1 = Z1 (Z1 Z1 )1 Z1 ;
0 Z ;
(, ) = ^
= 0 Z1 +
2

(, ) = Q Z1 (Z1 Z1 )1 Z1 + RZ2 (Z2 RZ2 ) Z2 ;


(, ) = Z1 (Z1 Z1 )1 Z1 + RZ2 (Z2 RZ2 ) Z2 R ;
(, , ) = ^
= 0 Z = Z(Z Z) Z ;
(|) = (, ) () = RZ2 (Z2 RZ2 ) Z2 R ;
(|, ) = (, , ) (, );
(|, ) = 0 Z Z1 (Z1 Z1 )1 Z1 RZ2 (Z2 RZ2 ) Z2 R .
A partir dessas somas de quadrados, como mostra Searle (1987),
possvel obter a anlise de varincia para um delineamento em blocos
casualizados, conforme apresentam-se na Tabela 13.
Tabela 13

Somas de quadrados para a anlise de varincia de um DBC, por meio


de reduo de modelos.

FV
Mdia

GL
(X1 )

SQ
()

Tratamento

(X2 ) (X1 )

(|)

Bloco

(X) (X2 )

(|, )

Resduo

(I() ) (X)

(, , )

Total

(I() )

81

comum obter as somas de quadrados de blocos e tratamentos,


respectivamente, por (|) e (|, ).

Entretanto, como, neste

trabalho, so estudados apenas experimentos balanceados, as duas formas


de obteno das somas de quadrados se equivalem.
Ao substituir = L , Z1 = L X1 , Z2 = L X2 , Z3 = L X3 e
V1 = LL , essas somas de quadrados so dadas por
= V1 X1 (X1 V1 X1 )1 X1 V1 ;
= RV X2 (X2 RV X2 ) X2 RV ;
= V1 X(X V1 X)1 X V1 RV X2 (X2 RV X2 ) X2 RV
V1 X1 (X1 V1 X1 )1 X1 V1 ;
= V1 V1 X(X V1 X)1 X V1 ;
= V1 V1 X1 (X1 V1 X1 )1 X1 V1 ;
em que RV = V1 V1 X1 (X1 V1 X1 )1 X1 V1 .
Com isso, a anlise de varincia que considera a correlao espacial
entre os erros pode ser representada, por meio de formas quadrticas,
conforme mostra a Tabela 14.
Tabela 14

Anlise de varincia de um DBC, cujos erros so espacialmente


correlacionados.

FV
Tratamento

GL
(X2 ) (X1 )

SQ

Bloco

(X) (X2 )

(P P1 P2 )

Resduo

(V1 ) (X)

(V1 P)

Total

(V1 ) (X1 )

(V1 P1 )

em que P = V1 X(X V1 X)1 X V1 , P2 = RV X2 (X2 RV X2 ) X2 RV


e P1 = V1 X1 (X1 V1 X1 )1 X1 V1 .

82

4.3.2

Esperanas dos quadrados mdios


Conforme visto na seo (2.2.3), o modelo estatstico de um

delineamento em blocos casualizados representado por


= + + + ,

com

= 1, 2, . . . , e = 1, 2, . . . , .

(4.15)

De acordo com este modelo, os somas de quadrados de tratamento,


blocos e resduos so dadas da seguinte maneira:

1 2 2
,

=1

=1 =1

1 2
2
e

=1

=1

=1

2
1 2 1 2

+ ;

cujos respectivos quadrados mdios so

, =
e =
.
1
1
( 1)( 1)

Em um delineamento em blocos casualizados h duas formas


de considerar a dependncia espacial dos erros:

dependncia espacial

apenas dentro dos blocos e dependncia espacial dentro e entre os blocos.


Considerando que existe dependncia espacial apenas dentro dos blocos e
mantendo as pressuposies de que os erros tm mdia zero e varincia
constante, tem-se que
[ ] = 0,
[ ] = 2 ,
[ , ] = [ ] = 0 para algum = e

83

[ , ] = 0 = .
Desse modo, as esperanas dos quadrados mdios apresentados so
dadas conforme a Tabela 15.
Tabela 15

Esperana dos quadrados mdios de um DBC cujos erros tm


dependncia dentro dos blocos.

FV
Tratamento
Blocos

2 +

2 +

E[QM]

1
2
2( , )
( 1)

1
2
+
2( , )
1

Resduo

>

1
( 1)

>

2( , )

>

Entretanto, ao considerar que existe dependncia espacial dentro


e entre os blocos, tem-se que [ , ] = 0 para algum = e, com
isso, as esperanas dos quadrados mdios da anlise de varincia so dadas
conforme a Tabela 16, de modo que T, U e V so as mesmas equaes
definidas nas seo (4.2.3).
Tabela 16

Esperana dos quadrados mdios de um DBC cujos erros tm


dependncia dentro e entre blocos.

FV
Tratamento
Blocos
Resduo

2 +

2 +

2 +

E[QM]
1
1
2 +

( + )

( 1)
2 +

1
1

( + )

( 1)

1
1
( ) +

( 1)
( 1)( 1)

84

J as esperanas dos quadrados mdios da anlise de varincia


apresentada na Tabela 14, na qual a matriz de correlao V utilizada no
clculo da somas de quadrados, so dadas por:
Tabela 17

Esperana dos quadrados mdios da anlise de varincia de um DBC,


considerando dependncia espacial.

FV
Tratamento
Blocos

E[QM]
2 +

( X2 P2 X2

2 +

+ X3 P2 X3 + 2 X2 P2 X3 )
(X2 ) 1

( X2 GX2 + X3 GX3 + 2 GX3 )


(X) (X2 )

Resduo

em que G = RV P2 = RV RV X2 (X2 RV X2 ) X2 RV .

4.3.3

Aplicabilidade do teste F
Para garantir a validade do teste F, utilizado para comparar a

igualdade entre as mdias dos tratamentos e a igualdade entre as mdias


dos blocos, primeiramente, necessrio mostrar que as variveis aleatrias
/ 2 , / 2 e / 2 seguem distribuies qui-quadrado
(2 ).
A soma de quadrados de resduos tem a mesma expresso para os
delineamentos inteiramente casualizados e em blocos casualizados. Desse
modo, conforme demonstrado na seo (4.2.4), / 2 tem distribuio
2 central, com (X) graus de liberdade.
O mesmo procedimento da seo anterior ser utilizado para
mostrar que / 2 2 .

= [R X2 (X2 R X2 ) X2 R ].
2

85

em que R = 1 1 X1 (X1 1 X1 ) X1 1 .
Definindo D = R X2 (X2 R X2 ) X2 R , necessrio mostrar que
D idempotente. Observe que
R R = 1 21 X1 (X1 1 X1 )1 X1 1 + 1 X1 (X1 1 X1 )1 X1 1 ;
R R = 1 1 X1 (X1 1 X1 ) X1 1 = R .

Desse modo
DD = R X2 (X2 R X2 ) X2 R R X2 (X2 R X2 ) X2 R ;
DD = R X2 (X2 R X2 )+ X2 R X2 (X2 R X2 )+ X2 R ;
DD = R X2 (X2 R X2 )+ X2 R = D.
Com isso, / 2 tem distribuio 2 no central, com
parmetro de no centralidade = X P2 X/2 2 e graus liberdade dado
por
(D) = (P2 ) = ([I() X1 (X1 1 X1 )1 X1 1 ]X2 (X2 R X2 )+ X2 R );
(D) = (X1 (X1 1 X1 )1 X1 1 X2 (X2 R X2 )+ X2 R ) +
+ (X2 (X2 R X2 )+ X2 R );
(D) = (X2 R X2 (X2 R X2 )+ ) = (X2 R X2 ) = (X2 ) 1.
A prxima etapa mostrar que / 2 tem distribuio
qui-quadrado 2 . Para isso, definindo

D = R X2 (X2 R X2 )+ X2 R ,

M = 1 X(X 1 X)+ X 1 e N = 1 X1 (X1 1 X1 )+ X1 1 , basta


mostrar que (M D N) idempotente:
(MDN)(MDN) = [MMMDMNDM+DD+
DN NM + ND + NN];
Facilmente, pode-se verificar que MM = M, DD = D e
NN = N. Alm disso, substituindo X(X 1 X)+ X 1 X1 = X1

86

X1 = X1 1 X(X 1 X)+ X , tem-se que MN = NM = N. Pode-se


notar ainda que
DN = R X2 (X2 1 X2 )+ X2 (1 N)N;
DN = R X2 (X2 1 X2 )+ X2 (N N) = 0;
ND = N(1 N)X2 (X2 1 X2 )+ X2 R ;
ND = (N N)X2 (X2 1 X2 )+ X2 R = 0.
Dado X(X 1 X)+ X 1 X2 = X2 e X2 1 X(X 1 X)+ X =
X2 , possvel mostrar que
DM = R X2 (X2 1 X2 )+ X2 (1 N)M;
DM = R X2 (X2 1 X2 )+ X2 M R X2 (X2 1 X2 )+ X2 N;
DM = R X2 (X2 1 X2 )+ X2 1 R X2 (X2 1 X2 )+ X2 N;
DM = R X2 (X2 1 X2 )+ X2 (1 N) = D.
MD = M(1 N)X2 (X2 1 X2 )+ X2 R ;
MD = MX2 (X2 1 X2 )+ X2 R NX2 (X2 1 X2 )+ X2 R ;
MD = 1 X2 (X2 1 X2 )+ X2 R NX2 (X2 1 X2 )+ X2 R ;
MD = (1 N)X2 (X2 1 X2 )+ X2 R = D.
Sendo assim
(M D N)(M D N) = [M D N D + D + 0 N + 0 + N];
(M D N)(M D N) = (M D N).
Portanto, / 2 tem distribuio 2 com (M D N) =
(P P1 P2 ) = (X) (X2 ) graus de liberdade e parmetro de no
centralidade dado por
=

1
X (RV P2 )X.
2 2

Dessa forma, j que / 2 , / 2 e / 2 seguem


distribuies qui-quadrado, para garantir a validade do teste F para

87

comparar a igualdade entre as mdias dos tratamentos basta mostrar que


/ 2 e / 2 so variveis aleatrias independentes. Do mesmo
modo, para garantir a validade desse teste para comparar a igualdade entre
as mdias dos blocos, necessrio mostrar que / 2 e / 2
so independentes. Para isso, dado que

= A, com A = 1 1 X(X 1 X)+ X 1 = 1 M;


2

= D, com D = R X2 (X2 R X2 ) X2 R ;
2

= (M D N), com M = 1 X(X 1 X)+ X 1 e


2
N = 1 X1 (X1 1 X1 )+ X1 1 ,
para demonstrar a independncia entre as variveis de interesse, conforme
afirma Graybill (1976), basta mostrar que DA = 0 e (MDN)A =
0:
DA = R X2 (X2 R X2 ) X2 (1 N)(1 M);
DA = R X2 (X2 R X2 ) X2 (1 M N + NM);
DA = R X2 (X2 R X2 ) X2 (1 M);
DA = R X2 (X2 R X2 ) (X2 1 X2 1 ) = 0.
(M D N)A = (M D N)(1 M);
(M D N)A = M MM D + DM N + NM;
(M D N)A = M M D + D N + N = 0.
Com isso, pode-se concluir que
( / 2 )/(x2 ) 1

=
(1 , 2 ; ) ,
2
(/ )/ (X)

88

(/ 2 )/(X) (X2 )

=
(3 , 2 ; ) ,
(/ 2 )/ (X)

de forma que
=

4.4

1 = (X2 ) 1,

2 = (X),

3 = (X) (X2 ),

1
1
X P2 X e = 2 X (RV P2 )X .
2
2
2
Anlise dos dados simulados
No intuito de avaliar a eficincia da anlise de varincia que

considera a informao de dependncia espacial dos erros, para as quatro


configuraes de experimentos apresentadas na seo (3.1), foram simulados
500 conjuntos de dados, de acordo com cada configurao de dependncia
espacial analisada. Essa avaliao foi realizada com base na comparao da
estatstica F0 obtida nas abordagens espacial e clssica.
O que espera-se que a abordagem espacial seja mais eficiente na
deteco de diferenas entre as mdias dos tratamentos, uma vez que os
experimentos foram simulados de forma que essas diferenas existam. Para
isso, espera-se que a estatstica F0 seja maior na anlise de varincia com
abordagem espacial.
Na Tabela 18 apresentam-se os resultados para os experimentos
instalados em um DIC com 15 tratamentos e 8 repeties. Nesta mesma
tabela possvel observar que, para cada configurao (efeito pepita,
patamar, alcance) so apresentadas a porcentagem das simulaes nas quais
a considerao da informao espacial resultou em um aumento do valor
da estatstica F0 , a porcentagem das simulaes nas quais as abordagens
espacial e clssica obtiveram resultados iguais e, por fim, a porcentagem
mdia de aumento da estatstica F0 , ao se considerar a dependncia espacial
dos erros.

interessante ressaltar que foram avaliados apenas o valor

pontual de aumento e igualdade da estatstica F0 , nas duas abordagens


consideradas.
Por exemplo, para a configurao (0,1; 2,5; 3), considerando o

89

modelo esfrico, pode-se observar que a modelagem da dependncia espacial


dos erros resultou em um aumento da estatstica F0 em 86,0% dos conjuntos
de dados simulados. Ainda nessa configurao, em 0,6% das simulaes, os
resultados das duas abordagens coincidiram. Porm, houve um aumento
mdio de 31,5% no valor da estatstica F0 , quando se utilizou a abordagem
espacial.
Tabela 18

Avaliao da abordagem geoestatstica de um DIC com 15 tratamentos


e 8 repeties.

Configurao

(0,10;
(0,10;
(0,10;
(0,75;
(0,75;
(0,75;

2,5;
2,5;
2,5;
2,5;
2,5;
2,5;

3)
6)
9)
3)
6)
9)

Modelo esfrico

Modelo exponencial

Aumento

Iguais

Mdia

Aumento

Iguais

Mdia

86,0
93,6
90,4
56,4
82,4
64,2

0,6
0,0
0,2
2,2
0,8
1,6

31,50
88,48
96,41
7,75
22,81
21,08

78,6
84,6
86,0
49,0
52,0
45,2

8,0
6,2
4,4
22,4
19,0
21,2

39,77
56,68
62,94
9,44
9,94
7,39

J na Tabela 19 possvel observar os resultados obtidos quando


foram analisados experimentos instalados sob um DIC com 6 tratamentos
e 5 repeties.
Tabela 19

Avaliao da abordagem geoestatstica de um DIC com 6 tratamentos


e 5 repeties.

Configurao

(0,10;
(0,10;
(0,10;
(0,75;
(0,75;
(0,75;

2,5;
2,5;
2,5;
2,5;
2,5;
2,5;

2)
4)
6)
2)
4)
6)

Modelo esfrico

Modelo exponencial

Aumento

Iguais

Mdia

Aumento

Iguais

Mdia

32,6
71,0
72,4
22,8
46,8
47,4

30,8
7,6
8,0
43,6
22,0
22,4

4,83
49,84
65,43
14,15
15,28
19,35

48.0
55.6
61.6
36.8
39.2
36.2

24,2
17,4
16,0
33,6
33,2
37,2

17,83
36,35
34,65
5,49
9,44
8,13

Analisando-se os resultados das Tabelas 18 e 19 possvel observar

90

que, em ambos os modelos, esfrico e exponencial, a modelagem da


dependncia espacial dos erros apresentou resultados ainda melhores na
presena de forte grau de dependncia espacial, ou seja, em experimentos
gerados com menor efeito pepita.
Com relao ao alcance, o que se pode notar que, para maiores
alcances, os resultados a favor da abordagem espacial so melhores. Alm
disso, observa-se, ainda, que quanto menor o alcance maior a porcentagem
de resultados iguais para as duas abordagens, o que pode ser justificado pelo
fato de que, quanto menor o alcance maior a chance de se ajustar o modelo
de efeito pepita puro ao semivariograma dos erros e, com isso, a matriz V
reduz-se a uma matriz identidade, tornando idnticas as expresses das
somas de quadrados das anlises clssica e espacial.
Comparando-se os modelos esfrico e exponencial, o que se pode
perceber que, para alcances maiores, a porcentagem mdia de aumento
da estatstica F0 ao se considerar a depedncia espacial dos erros maior
quando considerado o modelo esfrico.
Em relao ao nmero de parcelas do experimento, o que se nota
que a modelagem da dependncia espacial dos erros mais eficiente,
considerando-se o aumento do valor da estatstica 0 , em experimentos com
maior nmero de parcelas.
As Tabelas 20 e 21 referem-se avaliao da abordagem espacial
com relao aos efeitos de tratamento e bloco, respectivamente, de
experimentos instalados de acordo com um DBC com 15 tratamento e 8
blocos.
Analisando-se os dados da Tabela 20 possvel notar que, assim
como nos experimentos em DIC, os melhores resultados a favor da
abordagem espacial ocorreram na presena de forte grau de dependncia
espacial.
Comparando-se os modelos esfrico e exponencial, pode-se verificar
que a porcentagem das simulaes nas quais as abordagens clssica e espacial
coincidiram maior no modelo exponencial.

91
Tabela 20

Avaliao da abordagem geoestatstica de um DBC com 15


tratamentos e 8 blocos, em relao ao efeito de tratamento.

Configurao

(0,10;
(0,10;
(0,10;
(0,75;
(0,75;
(0,75;

2,5;
2,5;
2,5;
2,5;
2,5;
2,5;

3)
6)
9)
3)
6)
9)

Modelo esfrico

Modelo exponencial

Aumento

Iguais

Mdia

Aumento

Iguais

Mdia

41,8
74,4
69,2
19,6
41,8
26,2

0,2
0,6
0,2
0,4
4,4
10,2

1,81
33,89
29,44
-8,67
0,50
-7,54

40,6
52,6
55,2
16,6
16,6
11,6

32,6
28,2
25,4
48,8
49,0
59,0

7,09
12,86
14,09
-1,18
-2,18
-1,92

Pode-se verificar, ainda, que, em geral, a distncias maiores,


a porcentagem mdia de aumento da estatstica F0 ao se considerar a
dependncia espacial dos erros tambm aumentou.
Tabela 21

Avaliao da abordagem geoestatstica de um DBC com 15


tratamentos e 8 blocos, em relao ao efeito de bloco.

Configurao

(0,10;
(0,10;
(0,10;
(0,75;
(0,75;
(0,75;

2,5;
2,5;
2,5;
2,5;
2,5;
2,5;

3)
6)
9)
3)
6)
9)

Modelo esfrico

Modelo exponencial

Aumento

Iguais

Mdia

Aumento

Iguais

Mdia

51,0
75,0
73,4
28,8
38,6
26,2

0,2
0,6
0,2
5,4
4,4
10,2

6,04
52,02
30,12
-5,15
-0,44
-4,9

41,8
49,4
47,0
15,2
11,8
8,0

32,6
28,2
25,2
48,4
49,0
59,0

6,54
10,54
11,94
-2,15
-3,25
-2,76

De acordo com os dados Tabela 21, pode-se dizer que, ao gerar


dados com moderada dependncia espacial, isto , com efeito pepita 0,75, a
considerao da informao espacial na construo da anlise de varincia
forneceu, em mdia, valores para 0 menores do que os encontrados por
meio da anlise que supunha independncia espacial dos erros.
Com relao ao parmetro alcance, observa-se que, considerando o
efeito pepita 0,1, o nmero de simulaes nas quais a abordagem espacial
resultou em valores maiores para 0 , comparando-se aos valores obtidos pela

92

abordagem espacial, maior quando se consideram maiores valores para o


parmetro alcance.
As Tabelas 22 e 23 referem-se avaliao da abordagem espacial
com relao aos efeitos de tratamento e bloco, respectivamente, de
experimentos instalados de acordo com um DBC com 6 tratamento e 5
blocos.
Tabela 22

Avaliao da abordagem geoestatstica de um DBC com 6 tratamentos


e 5 blocos, em relao ao efeito de tratamento.

Configurao

(0,10;
(0,10;
(0,10;
(0,75;
(0,75;
(0,75;

2,5;
2,5;
2,5;
2,5;
2,5;
2,5;

2)
4)
6)
2)
4)
6)

Modelo esfrico

Modelo exponencial

Aumento

Iguais

Mdia

Aumento

Iguais

Mdia

28,2
52,4
51,2
21,8
33,2
26,6

60,6
33,4
36,6
64,4
50,8
58,2

6,90
25,99
23,13
4,50
10,60
6,75

29,6
37,0
37,2
19,4
16,6
19,4

57,2
48,0
49,6
63,8
67,6
66,0

5,18
7,38
8,63
2,00
0,73
1,84

De acordo com os dados Tabela 22 possvel observar que houve


alta porcentagem de simulaes nas quais as abordagens espacial e clssica
obtiveram os mesmos resultados, ou seja, houve alta porcentagem de
simulaes, nas quais se ajustou um modelo de efeito pepita puro ao
semivariograma dos erros, significando que o semivariograma no detectou
dependncia espacial entre os erros. Esse resultado pode ser justificado
pelo fato de se estar analisando um experimento com pequeno nmero de
parcelas.
Com relao porcentagem de aumento da estatstica 0 , o que
se pode notar que a abordagem espacial apresentou melhores resultados
quando se considerou o modelo esfrico, de modo que, nesse modelo, o
valor de alcance 4 propiciou os melhores resultados em favor da abordagem
espacial.
Por fim, pode-se observar, ainda, que, assim como ocorreu nas
confiuraes de experimento analisadas anteriormente, ao se considerar o

93

valor de efeito pepita 0,1 a abordagem espacial foi mais eficiente do que se
considerando o valor de efeito pepita 0,75.
Na Tabela 23 possvel observar que a estatstica 0 , utilizada para
comparar as mdias dos blocos, em mdia, diminuiu quando a informao
espacial dos erros foi considerada. Um dos motivos que podem justificar esse
fato que a modelagem da dependncia espacial dos erros tenha conseguido
explicar os efeitos referentes aos blocos e, desse modo, a variabilidade
explicada por esse fator deixou de ser significaiva, resultando em valores
para 0 menores quando se considerou a estrutura de dependncia espacial.
Por fim, pode-se verificar, ainda, que, na maioria das configuraes,
a maior parte das simulaes resulou nos mesmos valores para 0
comparando-se as abordagens espacial e clssica.
Tabela 23

Avaliao da abordagem geoestatstica de um DBC com 6 tratamentos


e 5 blocos, em relao ao efeito de bloco.

Configurao

(0,10;
(0,10;
(0,10;
(0,75;
(0,75;
(0,75;

4.5

2,5;
2,5;
2,5;
2,5;
2,5;
2,5;

2)
4)
6)
2)
4)
6)

Modelo esfrico

Modelo exponencial

Aumento

Iguais

Mdia

Aumento

Iguais

Mdia

3,6
18,0
14,2
2,4
8,2
7,4

60,6
33,4
36,6
64,4
50,8
58,2

-3,99
-3,26
-5,72
-5,54
-6,25
-5,46

8,2
8,4
7,2
5,0
2,6
3,6

57,2
48,0
49,6
63,8
67,6
66,0

-5,39
-6,41
-6,11
-5,42
-5,90
-5,62

Exemplo de aplicao
Nesta seo, o intuito foi ilustrar a aplicao da anlise espacial de

experimentos com erros dependentes, discutida durante todo o trabalho. Os


dados analisados foram obtidos a partir de simulao, sendo consideradas
as distncias entre os cenrtroides das parcelas, de modo que os erros foram
gerados seguindo modelo de semivarincia esfrico. Esse experimento foi
instalado de acordo com um delineamento em blocos casualizados (DBC)
composto por 26 tratamentos e 4 blocos. Esses dados podem ser visualizados

94

no ANEXO A.
Toda a anlise desse experimento foi implementada no software
R (R DEVELOPMENT CORE TEAM, 2012), de modo que as rotinas
utilizadas nesse tipo de anlise podem ser vistas no ANEXO C.
A seguir sero descritos os passos bsicos necessrios para a
construo da anlise de varincia, considerando-se dependncia espacial
dos erros.
1 passo: Deteco da variabilidade espacial
O primeiro passo da anlise espacial de um experimento verificar
se existe variabilidade espacial dos erros. Na Figura 5 observa-se o grid
desse experimento, no qual so especificados os blocos que o compem. Os
pontos identificados nesse grfico referem-se aos erros otidos a partir de uma
anlise clssica. Esses erros foram divididos em quatro grupos, de acordo
com o quartil a que pertencem, conforme apresentado na Figura 5.

Figura 5

Grid do experimento contendo informaes sobre os erros referentes a


cada ponto amostrado

95

Por meio Figura 5 possvel perceber que os pontos mais prximos


apresentam maior similaridade do que pontos mais distantes, indicando que
pode existir uma dependncia espacial entre os erros. Conforme visto na
seo (3.3), a verificao da existncia dessa dependncia espacial pode ser
feita por meio da anlise grfica do semivariograma. Esse semivariograma
contrudo a partir dos resduos aps a retirada de tendncia que, neste
caso, refere-se tendncia ocasionada pelos efeitos de tratamentos e blocos,
ou seja, os resduos obtidos na anlise clssica.

Na seo citada, no

intuito de contornar os problemas de subjetividade, sugeriu-se, ainda, que


fossem construdos envelopes, obtidos por meio da permutao dos valores
observados nas posies espaciais, para auxiliar na deteco da estrutura de
dependncia espacial. O Grfico 6 mostra o semivariograma dos erros e o
envelope construdo para o mesmo.

Grfico 6

Semivariograma dos erros contendo o envelope simulado

Observando-se o semivariograma do Grfico 6 percebe-se que o


mesmo apresenta uma estrutura de dependncia espacial definida, em que os

96

valores de semivarincia aumentam de acordo com o aumento dos valores da


distncia (h) at um determinado valor, a partir do qual a semivarincia se
estabiliza. A construo do envelope confirma a existncia de dependncia
espacial, uma vez que possvel observar a existcia de pontos do grfico
que no pertence ao intervalo criado.
2 passo: Ajuste do semivariograma dos erros
De posse do semivariograma experimental, a etapa seguinte
caracterizou-se pelo ajuste de um modelo terico a esse semivariograma.
Esse ajuste foi realizado pelo mtodo de quadrados mnimos ordinrios. O
modelo ajustado ao semivariograma dos erros foi o modelo esfrico, de modo
que esse ajuste foi realizado pelo mtodo de quadrados mnimos ordinrios.
Para se obter estimativas mais eficientes para os parmetros do
semivariograma, foram realizadas vrias iteraes, at que os valores dessas
estimativas se estabilizassem.

Nesse processo iterativo, os parmetros

estimados a cada iterao foram utilizados para modelar a matriz de


correlao V, utilizada na ponderao da soluo do sistema de equaes
normais (S.E.N), a partir da qual obtm-se a estimao do vetor de
parmetros dos efeitos fixos do modelo. Com esse novo vetor de parmetros
estimados foi possvel atualizar o vetor de erros, construir novamente o
semivariograma e, com isso, atualizar as estimativas dos parmetros.
Na Tabela 24 observam-se os valores estimados para os parmetros
do semivariograma a cada iterao, de modo que 2 representa a
contribuio, 2 o efeito pepita e o alcance prtico.
Tabela 24

Parmetros estimados do semivariograma a cada iterao.

Parmetros
2
2

1
1,1062
0,4647
22,1173

2
1,8008
0,1406
22,5271

Iteraes
3
4
1,9458
1,9606
0,1073
0,1056
22,2722 22,2354

5
1,9616
0,1055
22,2327

6
1,9616
0,1055
22,2327

97

De acordo com essa tabela, possvel observar que, a partir da


5 iterao, esses valores estabilizaram e, portanto, os valores estimados
correspondentes a essa iterao foram utilizados para a modelagem da
matriz de covarincia dos erros.
O ajuste do modelo esfrico, utilizando-se os valores dos
parmetros estimados na 5 iterao, pode ser observado no Grfico 7.

Grfico 7

Ajuste do modelo esfrico ao semivariograma dos erros

3 passo: Obteno da anlise de varincia


Aps ajustar o modelo terico adequado ao semivariograma e,
consequentemente, calcular a matriz de covarincias dos erros, a etapa
seguinte consistiu em construir a anlise de varincia que considerasse a
estrutura de dependncia espacial dos erros. Essa anlise de varincia,
apresentada na Tabela 25, foi construda a partir das expresses contidas
na Tabela 14, apresentada na seo 4.3.1.

98
Tabela 25

Anlise de varincia, considerando erros correlacionados.

FV
Tratamento

GL
25

SQ
114,294

QM
4,572

0
1,728

p-valor
0,0367

Blocos

6,207

2,069

0,782

0,5076

Resduo

75

198,412

2,645

Total

103

318,913

Observando-se os dados da Tabela 25 possvel concluir que os


efeitos de tratamentos foram significativos ao nvel de 5% de probabilidade,
o que implica dizer que as mdias dos tratamentos no so todas iguais. J
em relao ao fator blocos, o que se pode concluir que no existe diferena
significativa entre as mdias dos blocos.
No intuito de comparar a abordagem clssica e a espacial, foi
construda a anlise de varincia clssica, cujas somas de quadrados foram
calculadas por meio das expresses usuais, desconsiderando a informao
espacial dos dados. Na Tabela 26 apresenta-se essa anlise de varincia.
Tabela 26

Anlise de varincia, considerando erros independentes.

FV
Tratamento

GL
25

SQ
30,508

QM
1,2203

0
0,6428

p-valor
0,8924

Blocos

20,674

6,891

3,630

0,017

Resduo

75

142,372

1,8983

Total

103

193,554

De acordo com essa anlise, o que se pode observar que, ao


desconsiderar a informao sobre a dependncia espacial dos erros, os efeitos
de tratamentos foram considerados no significativos e, consequentemente,
aceitava-se a hiptese de igualdade entre as mdias dos tratamentos. J
os efeitos de blocos foram considerados significativos ao nvel de 5% de

99

probabilidade, o que significa dizer que as mdias dos blocos apresentavam


diferenas significativas.
4 passo: Estimativas dos componentes do modelo espacial
Esse passo considerado uma etapa complementar da anlise
de varincia, ou seja, o mesmo no necessrio para a sua obteno.
Entretanto, esse passo pode ser utilizado para a melhor compreenso dos
dados analisados.
Conforme visto na seo 2.1.4, um modelo espacial linear pode
ser decomposto em trs componentes:

uma tendncia constante (),

uma componente aleatria espacialmente correlacionada () e, por ltimo,


um erro aleatrio ou erro experimental () independente e identicamente
distribudo. Esses componentes podem ser estimados, respecivamente, por
0 = X0 ,

(4.16)

^ = 2 V 1 ( 0 ),

(4.17)

^
0 = 0 .

(4.18)

em que 0 = (X V1 X) X V1 e 2 V corresponde matriz de


covarincias de (), quando o efeito pepita ( 2 ) zero.
Os estimadores apresentados em (4.16), (4.17) e (4.18), foram
utilizados para se obter os componentes do modelo referente ao exemplo
analisado nessa seo. No ANEXO B possvel ver a decomposio dos
valores observados nessas trs componentes.
De acordo com Ribeiro Jnior e Diggle (2001), esses componentes
podem ser facilmente obtidos por meio dos seguintes comandos do software
R:
geodados <- as.geodata(dados,coords.col = 1:2,data.col = 3,
covar.col=4:5 )
componentes<-likfit(geodados,trend=~trat+bloco, ini=c(1,10),
cov.model = "sph")$model.components

100

O arquivo de dados desse comando um data.frame que contm


as coordenadas nas colunas 1 e 2, os dados observados na coluna 3 e
os efeitos de tratamento e bloco nas colunas 4 e 5. Alm disso, para a
anlise de experimentos, os tratamentos e blocos devem ser tranformados
em fatores. Vale ressaltar ainda que a funo likfit ajusta o modelo terico ao
semivariograma por meio dos mtodos de mxima verossimilhana (default)
ou mxima verossimilhana restrita.
Conforme visto na seo 2.1.4, dado o modelo apresentado em
(2.16), assume-se que () tem varincia 2 e funo de covarincia ()
parametrizada por (alcance). De acordo com esse modelo, assume-se,
ainda, que () uma varivel aleatria independente e identicamente
distribuda com mdia zero e varincia 2 .
Afim de verificar, intuitivamente, se essas suposies foram
^ e do
satisfeitas, foi contrudo o semivariograma da componente espacial ()
erro experimental ( 0 ), apresentados no Grfico 8. A esses semivariogramas
foi ajustado o modelo esfrico a partir do mtodo de quadrados mnimos
ordinrios.

Grfico 8

(a) Semivariograma com ajuste do modelo terico da componente


espacial ^ e (b) dos erros estimados 0

101

A partir da anlise desses grficos possvel observar que o


semivariograma da componente espacial descreve toda a variabilidade
espacial presente nos dados. Por sua vez, ao semivariograma dos erros
ajustou-se o modelo de efeito pepita puro, o que significa dizer que, a
partir da menor distncia amostrada, no existe dependncia espacial entre
os erros estimados e, portanto, a variabilidade dos erros totalmente
decorrente do acaso. Esses resultados comprovam, subjetivamente, que as
suposies em relao s distribuies dos componentes do modelo foram
atendidas.

102

CONCLUSES
Na anlise de experimentos, mesmo que os erros apresentem-se

espacialmente correlacionados, possvel continuar desfrutando da anlise


de varincia como ferramenta para comparar as diferentes fontes de
variabilidade. No entanto, para que isso ocorra, necessrio que a matriz
de correlao dos erros seja considerada uma ponderadora das somas de
quadrados.
importante ressaltar que a anlise de varincia apresentada neste
trabalho no tem como enfoque reduzir a variabilidade residual e, sim obter
estimadores dessa variabilidade que considerem a estrutura de dependncia
espacial, de modo que a anlise de varincia continue sendo uma ferramenta
apropriada para avaliar a igualdade entre as mdias dos fatores controlados
no experimento.
Na abordagem espacial, o ajuste do semivariograma exerce um
papel fundamental e determinante para a eficincia dessa anlise. Diante
disso, a modelagem do semivariograma deve ser uma etapa cautelosa, a qual
exige, alm de conhecimentos geoestatsticos, o conhecimento do fenmeno
que se deseja modelar.
Em experimentos com pequeno nmero de parcelas no possvel
estimar precisamente os parmetros do semivariograma, resultando, muitas
vezes, no ajuste do efeito pepita puro ao semivariograma. Ao ajustar o
modelo de efeito pepita puro, a matriz de correlao dos erros reduz-se a uma
matriz identidade, fazendo com que a anlise de varincia considerando a
dependncia espacial dos erros seja exatamente a mesma anlise de varincia
obtida por meio da abordagem clssica.
Em geral, em experimentos com maior nmero de parcelas, a
modelagem da correlao espacial dos erros tornou a anlise mais eficiente,
uma vez que, na maioria das vezes, produziu maiores valores para a
estatstica 0 , com isso, aumentando a chance de se detectar diferenas
entre as mdias dos tratamentos.
Diante do que foi exposto, entende-se que realmente necessria

103

a difuso da abordagem da anlise espacial de experimentos, uma vez que


a considerao da informao sobre a dependncia espacial dos erros pode
alterar completamente as concluses sobre um determinado experimento.

104

REFERNCIAS
BANZATTO, D. A.; KRONKA, S. N. Experimentao agrcola. 4. ed.
Jaboticabal: FUNEP, 2006. 237 p.
BARBIN, D. Componentes de varincia: teoria e aplicaes. 2 ed.
Piracicaba: FEALQ, 1998. 120 p.
BURROUG, P.; Principles of geographical information systems for
land resources assessment. Oxford: Clarendon, 1987. 193 p.
CAMBARDELLA, C. A. et al. Field scale variability of soil properties in
central Iowa soils. Soil Science Society of America Journal, Madison,
v. 58, n. 5, p. 1501-1511, 1994.
CAMPOS, J. F. Eficincia da anlise estatstica espacial na
classificao de famlias do feijoeiro: estudo via simulao. 2011. 62
p. Dissertao (Mestrado em Estatstica Aplicada a Biometria)
Universidade Federal de Viosa, Viosa, MG, 2011.
CRESSIE, N. Statistics for spatial data. 2nd ed. New York: J. Wiley,
1993. 900 p.
COCHRAN, W. G. Some consequences when the assumptions for the
analysis of the variance are not satisfied. Biometrics, Raleigh, v. 3, n.
1, p. 3-22, 1947.
DIGGLE, P. J.; RIBEIRO JNIOR, P. J. Model-based geostatistics.
New York: Springer, 2007. 230 p.
DUARTE, J. B. Sobre o emprego e a anlise estatstica do
delineamento em blocos aumentados no melhoramento gentico
vegetal. 2000. 293 p. Tese (Doutorado em Agronomia) - Escola Superior
de Agricultura Luiz de Queiroz, Piracicaba, 2000.
DUARTE, J. B.; VENCOVSKY, R. Spatial statistical analysis and
selection of genotypes in plant breeding. Pesquisa Agropecuria
Brasileira, Braslia, v. 40, n. 2, p. 107-114, fev. 2005.

105

GRAYBILL, F. A. Theory and application of the linear model.


Boston: Duxbury, 1976. 704 p.
GRONDONA, M. O.; CRESSIE, N. Using spatial considerations in the
analysis of experiments. Technometrics, Alexandria, v. 33, n. 4, p.
381-392, 1991.
GUIMARES, E. C. Geoestatstica bsica e aplicada. Uberlndia:
UFU/FAMAT, 2004. 77 p. Apostila.
HINKELMANN, K.; KEMPTHORNE, O. Designs and analysis of
experiments: introduction to experimental design. New York: J. Wiley,
1994. v.1, 495 p.
HOEF, J. M. ver; CRESSIE, N. Spatial statistics: analysis of field
experiments. In SCHEINER S.; GUREVITCH, J. (Ed.). Design and
analysis of ecological experiments. London: Chapman and Hall, 1993.
p. 319-341.
ISAAKS, E. H.; SRIVASTAVA, R. M. An introduction to applied
geostatistics. New York: Oxford University, 1989. 561 p.
JOURNEL, A. G. Fundamentals of geostatistics in five lessons.
Washington: American Geophysical Union, 1989. 40 p.
. Geostatistics for the enviromental sciences. Las Vegas:
Report of United States Enviromental Protection Agency, 1987. 135 p.
JOURNEL, A. G.; HUIJBREGTS, C. J. Mining geostatistics. London:
Academic Press, 1978. 600 p.
KEMPTHORNE, O. Why Randomize? Journal of Statistical Planing
and Inference, Amsterdam, v. 1, p. 1-25, 1977.
MARTINEZ, R. Control de la correlacin espacial en experimentos de
campo em el sector agricola. Agronomia Colombiana, Bogot, v. 11, p.
83-89, 1994.

106

MATHERON, G. Traite de geostatistique appliqque, Tome I.


Mmoires du Bureau de Recherches Gologiques et Minires, Paris:
Technip, 1962. 333 p.
MCBRATNEY, A. B.; WEBSTER, R. Choosing functions for
semivariograms of soil properties and fitting them to sampling estimates.
Journal of Soil Science, New Brunswick, v. 37, n. 6, p. 617-639, 1986.
MONTGOMERY, D. C. Design and analysis of experiments. 7th ed.
Hoboken: J. Wiley, 2008. 656 p.
MOOD, A. M.; GRAYBILL, F. A.; BOES, D. C. Introduction to the
theory of statistics. 3rd ed. Tokio: McGraw-Hill Kogakusha, 1974. 564
p.
OLIVEIRA, M. S. de. Planos amostrais para variveis espaciais
utilizando geoestatstica. 1991. 100 p. Dissertao (Mestrado em
Estatstica) Universidade Estadual de Campinas, Campinas, 1991.
PONTES, J. M. Geoestatstica: aplicaes em experimentos de campo.
2002. 82 p. Dissertao (Mestrado em Agronomia - Estatstica e
Experimentao Agropecuria) Universidade Federal de Lavras, Lavras,
2002.
R DEVELOPMENT CORE TEAM. R: a language and environment for
statistical computing. Version 2.14.2. Vienna: R Foundation for Statistical
Computing, 2012. Disponvel em: <http://www.r-project.org>. Acesso
em: 10 mar. 2012.
REIS, A. J. dos S.; MIRANDA FILHO, J. B. de. Autocorrelao espacial
na avaliao de compostos de milho para resistncia lagarta do cartucho
(Spodoptera frugiperda). Pesquisa Agropecuria Tropical, Goinia, v.
33, n. 2, p. 65-72, 2003.
RENCHER, A. C.; SCHAALJE, G. B. Linear models in statistics. 2nd
ed. Hoboken: Wiley-Interscience, 2008. 672 p.

107

RIBEIRO JNIOR, P. J. Mtodos geoestatsticos no estudo da


variabilidade espacial de parmetros do solo. 1995. 99 f.
Dissertao (Mestrado em Agronomia) - Escola Superior de Agricultura
Luiz de Queiroz, Piracicaba, 1995.
RIBEIRO JNIOR, P. J.; DIGGLE, P. J. GeoR: a package for
geoestatistical analysis. R-News, London, v. 1, n. 2, p. 15-18, June 2001.
ROSSONI, D. F. Anlise de varincia para experimentos com
dependncia espacial. 2011. 108 p. Dissertao (Mestrado em
Estatstica e Experimentao Agropecuria) Universidade Federal de
Lavras , Lavras, 2011.
SCHLATHER, M. Random Fields: simulation and analysis of random
fields. R package version 2.0.59. Disponvel em:
<http://CRAN.R-project.org/package=RandomFields>. Acesso em: 10
nov. 2012.
SEARLE, S. R. Linear models. New York: J. Wiley, 1971. 536 p.
. Linear models for unbalanced data. New York: J. Wiley,
1987. 536 p.
STROUP, W. W.; BAENZIGER, P. S.; MULITZE, D. K. Removing
spatial variation from wheat yield trials: a comparison of methods. Crop
Science, Madison, v. 34, n. 1, p. 62-66, Jan. 1994.
ZIMMERMAN, D. I.; HARVILLE, D. A. A random field approach
to the anlysis of field-plot experiments and other spatial experiments.
Biometrics, Raleigh, v. 47, n. 1, p. 223-239, 1991.

108

ANEXO A - Conjunto de dados

Tabela 27
Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38

Conjunto de dados usados no exemplo de aplicao.


CoordX
524822,3
524886,6
524932,7
524975,5
524831,9
524897,5
524929,1
524972,4
524807,7
524874,5
524952,8
524985,4
524816,9
524883,8
524949,2
524982,4
524834,8
524890,6
524942,7
524995,4
524844,0
524901,8
524939,1
524992,2
524824,8
524870,2
524945,3
524990,4
524834,4
524879,1
524941,6
524987,3
524812,6
524876,5
524937,7
524967,8
524821,9
524886,0

CoordY
7569842
7569822
7569867
7569867
7569891
7569871
7569917
7569917
7569844
7569830
7569867
7569869
7569893
7569879
7569917
7569919
7569841
7569820
7569867
7569871
7569889
7569868
7569917
7569921
7569842
7569833
7569867
7569870
7569891
7569882
7569917
7569920
7569844
7569829
7569867
7569867
7569892
7569878

trat
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
5
5
5
5
6
6
6
6
7
7
7
7
8
8
8
8
9
9
9
9
10
10

bloco
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2

y
2,72965762
3,85774578
4,88034591
3,32146498
2,61821296
2,12708780
3,73484167
2,98415509
2,06788330
1,84389411
-0,06236613
5,45928759
2,63575713
0,99627626
2,88394902
3,02898110
2,27472516
1,82149956
1,08235752
6,28655463
4,88439380
0,76569249
2,20142496
2,79772211
2,44809917
1,68835769
3,82280712
5,91716355
3,72192438
2,73725198
2,52002699
1,74483556
1,57146954
3,77942758
3,15777696
2,88581649
1,62297704
0,58095273

109

Tabela 27,
Obs
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79

continua
CoordX
524934,1
524964,9
524829,9
524892,8
524940,2
524987,7
524839,4
524904,2
524936,6
524984,8
524810,3
524884,6
524930,2
524980,4
524819,5
524895,1
524926,4
524977,4
524827,3
524867,9
524955,4
524972,7
524836,9
524876,6
524951,6
524969,9
524815,1
524899,6
524927,7
524970,5
524824,5
524888,6
524924,0
524967,4
524805,3
524878,7
524935,2
524992,7
524814,5
524888,3
524931,5

CoordY
7569917
7569917
7569842
7569819
7569867
7569870
7569890
7569867
7569917
7569920
7569844
7569824
7569868
7569868
7569892
7569872
7569917
7569918
7569842
7569835
7569867
7569867
7569890
7569883
7569917
7569917
7569843
7569869
7569868
7569867
7569892
7569821
7569918
7569917
7569844
7569828
7569867
7569871
7569893
7569876
7569917

trat
10
10
11
11
11
11
12
12
12
12
13
13
13
13
14
14
14
14
15
15
15
15
16
16
16
16
17
17
17
17
18
18
18
18
19
19
19
19
20
20
20

bloco
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3

y
3,93060176
2,76032432
1,23415962
1,27569133
0,64414488
4,90664105
4,9624938
2,49568381
2,69825241
2,25309339
0,61759147
1,69706664
4,24812604
2,30390779
1,06595803
1,73003741
3,6466667
4,03946483
1,66912363
1,89804673
1,68328249
2,4872148
4,42154672
0,74670515
1,32730755
3,56429478
3,00862428
2,44022547
3,52500662
2,3721857
2,92101937
2,25920415
3,0215446
3,16494288
1,26152386
3,76978953
2,45535037
6,07665732
0,30127024
1,8400352
5,09727619

110

Tabela 27,
Obs
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104

concluso.
CoordX
524989,7
524820,1
524882,7
524950,4
524977,7
524829,5
524893,0
524946,6
524974,9
524832,4
524872,6
524947,8
524965,5
524841,9
524881,6
524944,1
524962,4
524817,6
524880,5
524925,2
524982,7
524826,9
524890,7
524921,4
524979,8

CoordY
7569921
7569843
7569825
7569867
7569868
7569891
7569873
7569917
7569918
7569841
7569832
7569867
7569867
7569890
7569880
7569917
7569917
7569843
7569826
7569868
7569869
7569892
7569875
7569918
7569919

trat
20
21
21
21
21
22
22
22
22
23
23
23
23
24
24
24
24
25
25
25
25
26
26
26
26

bloco
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4
1
2
3
4

y
2,43358911
2,32981675
3,08488474
0,52179681
1,41315988
2,98262907
1,42669735
3,22036924
4,43438716
2,92981601
1,15087931
-0,16823921
2,01154347
5,84492159
2,86438622
2,64892336
1,72124409
1,73945554
3,41730436
2,95138179
4,94352491
3,17731669
3,47098189
4,0546775
2,74822518

111

ANEXO B - Componentes do modelo


Tabela 28

Componentes do modelo espacial apresentado no exemplo de


aplicao.
Obs
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38

Tendncia
3,851434
3,322108
3,939470
4,793174
2,029570
1,500244
2,117606
2,971310
2,390178
1,860852
2,478214
3,331919
3,130319
2,600992
3,218355
4,072059
2,033903
1,504577
2,121939
2,975644
1,916927
1,387600
2,004963
2,858667
3,511136
2,981810
3,599173
4,452877
2,509134
1,979808
2,597170
3,450874
3,107599
2,578273
3,195635
4,049340
2,391470
1,862144

Espacial
-1,02313432
0,49108276
0,94800931
-1,5329293
0,62446574
0,44862356
1,6349501
0,13752829
-0,50672006
0,08842287
-2,37065891
2,03649166
-0,75861946
-1,30603002
-0,34433149
-1,06778066
0,30016479
0,29827039
-0,91859302
3,1492322
2,88727431
-0,41369422
0,17497715
-0,16748087
-1,06739323
-1,12420233
-0,18442768
1,7074542
1,25556754
0,54917986
-0,05069612
-1,56699817
-1,36284209
1,12186184
-0,11874319
-1,17663266
-0,72348715
-1,167149

Resduos
-0,098641825
0,044555399
-0,007133396
0,061219822
-0,035822537
0,178220616
-0,017714424
-0,124683655
0,184425232
-0,105380751
-0,169921581
0,0908771
0,264058005
-0,29868617
0,009925691
0,024702474
-0,059342562
0,018652377
-0,120988623
0,161678808
0,08019294
-0,208213703
0,021485031
0,106535732
0,004355952
-0,169250285
0,408062122
-0,243167789
-0,042776914
0,20826451
-0,026446882
-0,139040714
-0,173287345
0,079292912
0,080884948
0,013109485
-0,045005627
-0,114041947

112

Tabela 28

continua
Obs
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79

Tendncia
2,479506
3,333211
1,557801
1,028475
1,645837
2,499541
2,492006
1,962680
2,580042
3,433746
1,999684
1,470358
2,087720
2,941424
2,508662
1,979335
2,596698
3,450402
2,987332
2,458006
3,075369
3,929073
2,111305
1,581979
2,199341
3,053046
3,018049
2,488723
3,106085
3,959789
2,517736
1,988409
2,605772
3,459476
2,394062
1,864736
2,482099
3,335803
2,485123
1,955797
2,573160

Espacial
1,40486493
-0,68570299
-0,30670474
0,22887606
-0,88160306
2,28841498
2,49348139
0,39282336
0,27708709
-1,22234207
-1,27269018
0,36060141
1,84013088
-0,56053609
-1,28430003
-0,2176819
1,05064825
0,39836371
-1,16970026
-0,62505981
-1,4575344
-1,45981861
2,20406228
-0,63562107
-0,84011821
0,38586037
-0,24855358
-0,04287814
0,5731527
-1,50832458
0,21865528
0,30412924
0,52671814
-0,25418474
-1,0150329
1,74517908
0,08945643
2,66701814
-1,9391421
-0,14659151
2,28314805

Resduos
0,046230782
0,112816793
-0,016936348
0,018340694
-0,120089007
0,11868466
-0,022993299
0,140180872
-0,158876625
0,041689052
-0,109402129
-0,133892412
0,320275142
-0,076980601
-0,158403477
-0,031616089
-0,000679322
0,190698888
-0,148508595
0,065100191
0,065448172
0,017960232
0,106179431
-0,199652653
-0,031915485
0,125388707
0,239129136
-0,005618972
-0,154231029
-0,079279135
0,184628516
-0,033334523
-0,110945346
-0,040348647
-0,117505628
0,159874206
-0,116204676
0,073836098
-0,244711041
0,030829463
0,240968522

113

Tabela 28,

concluso.

Obs
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104

Tendncia
3,426864
2,582984
2,053658
2,671020
3,524725
2,779478
2,250151
2,867514
3,721218
2,050101
1,520775
2,138137
2,991842
2,845095
2,315769
2,933131
3,786836
2,627035
2,097709
2,715071
3,568776
3,207282
2,677956
3,295318
4,149022

Espacial
-0,96618802
-0,40841446
0,97872205
-2,17523172
-1,87780464
0,23298067
-0,60813684
0,20740201
0,61347591
0,68066527
-0,4031131
-2,03710806
-1,01729857
2,92301263
0,3078128
-0,18993259
-1,84224807
-0,75309951
1,32441261
0,26274309
1,20902003
0,02646902
0,54304301
0,69897947
-1,14686769

Resduos
-0,027086944
0,155247171
0,052504788
0,026008257
-0,233760216
-0,029829172
-0,215317241
0,145453432
0,099692981
0,199049927
0,033217739
-0,269268197
0,037000531
0,076814035
0,240804631
-0,094275207
-0,223343459
-0,134479849
-0,004817011
-0,02643243
0,16572929
-0,056433997
0,249983357
0,060380132
-0,253929493

114

ANEXO C - Rotinas em R

###################################################################
###### ANLISE DE UM DELINEAMENTO INTEIRAMENTE CASUALIZADO ######
###################################################################
### Pacotes utilizados ###
require(geoR)
require(fBasics)
require(RandomFields)
dados<-read.table("Exemplo.txt",sep=";", header=TRUE)
t=4
r=3

# nmero de tratamentos
# nmero de repeties

coords<-cbind(dados$CoordX, dados$CoordY)
######################################
##
exemplo do arquivo de entrada ##
## de dados de um DIC com t=4 e r=3 ##
##
##
## > dados
##
##
CoordX CoordY trat
y ##
## 1
0
0
1 16.92792 ##
## 2
1
0
1 17.66208 ##
## 3
2
0
1 17.57933 ##
## 4
0
1
2 19.58477 ##
## 5
1
1
2 22.44035 ##
## 6
2
1
2 22.65466 ##
## 7
0
2
3 16.94244 ##
## 8
1
2
3 17.68582 ##
## 9
2
2
3 17.00374 ##
## 10
0
3
4 18.49544 ##
## 11
1
3
4 18.46935 ##
## 12
2
3
4 19.94619 ##
######################################

### Construindo a matriz X ###


X1<-matrix(c(rep(1,r*t)),ncol=1)
X2<-kron(diag(t),c(rep(1,r)))
X<-cbind(X1,X2)

115

### Calculando o erro ###


Y<-c(dados$y)
theta<-ginv(t(X)%*%X)%*%t(X)%*%Y
erro<- data.frame(Y- X%*%theta)

### Anlise Geoestatstica ###


geodados <- as.geodata(data.frame(coords,erro),coords.col = 1:2,
data.col = 3)
geodados
h_max<- summary(geodados)[[3]][[2]]
dist<-0.5*h_max+2
vario.res <- variog(geodados,max.dist=dist)

### Envelope ###


geo.env <- variog.mc.env(geodados, obj.var = vario.res)
plot(vario.res, envelope = geo.env)

### Ajustando o modelo terico ###


ols<-variofit(vario.res,cov.model="sph",weights="equal",
max.dist=dist)
plot(vario.res)
lines(ols, col="blue", lty=1, lwd=2)
phi<-summary(ols)[[10]][[3]]
sill<-summary(ols)[[10]][[2]]
nugget<-summary(ols)[[10]][[1]]

# alcance
# contribuio
# ef. pepita

### Obtendo a matriz de covarincias ###


sigma<-varcov.spatial(coords = coords, cov.model = "sph", nugget =
nugget, kappa = 0.5,cov.pars = c(sill,phi))$varcov
V<- sigma*(1/(as.numeric(nugget+sill)))
i.V<-solve(V)
theta_dep<-ginv(t(X)%*%i.V%*%X)%*%t(X)%*%i.V%*%Y
erro<- data.frame(Y- X%*%theta_dep)

### Iteraes
repeat
{

###

116

geodados <- as.geodata(data.frame(coords,erro),coords.col = 1:2,


data.col = 3)
vario.res <- variog(geodados,max.dist=dist)
ols<-variofit(vario.res, cov.model="sph", weights="equal",
max.dist=dist)
phi1<-summary(ols)[[10]][[3]]
sill1<-summary(ols)[[10]][[2]]
nugget1<-summary(ols)[[10]][[1]]
sigma<-varcov.spatial(coords = coords, cov.model = "sph", nugget =
nugget1, kappa = 0.5, cov.pars = c(sill1,phi1))$varcov
i.V<-solve(sigma*(1/(as.numeric(nugget1+sill1))))
theta_dep<-ginv(t(X)%*%i.V%*%X)%*%t(X)%*%i.V%*%Y
erro<- data.frame(Y- X%*%theta_dep)
e1=phi-phi1
e2=sill-sill1
e3=nugget-nugget1
phi=phi1
sill=sill1
nugget=nugget1
if ((e1<0.0001) && (e2<0.0001) && (e3<0.0001)) break
}

### Obtendo as somas de quadrados ###


P1<-i.V%*%X1%*%solve(t(X1)%*%i.V%*%X1)%*%t(X1)%*%i.V
P<-i.V%*%X%*%ginv(t(X)%*%i.V%*%X)%*%t(X)%*%i.V
SQT<-t(Y)%*%(i.V-P1)%*%Y
SQRes<-t(Y)%*%(i.V-P)%*%Y
SQTrat<- t(Y)%*%(P-P1)%*%Y

### Soma de quadrados de tratamento via modelos reduzidos ###


R<-i.V - P1
SQtrat<-t(Y)%*%R%*%X2%*%ginv(t(X2)%*%R%*%X2)%*%t(X2)%*%R%*%Y
## Graus de liberdade ##
glt<-rk(i.V-P1)

117

glres<-rk(i.V-P)
gltrat<-rk(P-P1)

### Construindo a anlise de varincia ###


QMTrat<-SQTrat/gltrat
QMRes<-SQRes/glres
F.calc<-QMTrat/QMRes
pval<- 1-pf(F.calc,gltrat,glres)

anova<-data.frame(FV = c("Tratamento","Residuo","Total"),
GL = c(gltrat,glres,glt), SQ=round(c(SQTrat,SQRes,SQT),3),
QM = c(as.character(round(c(QMTrat,QMRes),3))," "),
F = c(as.character(round(F.calc,2)), " ", " "),
Pvalue = c(as.character(pval), " ", " "))
anova

### Anlise de varincia supondo erros independentes ###


reg<-lm(y~factor(trat),dados)
anova(reg)

### Obtendo os componentes do modelo espacial ###


theta_dep<-ginv(t(X)%*%i.V%*%X)%*%t(X)%*%i.V%*%Y
trend<-X%*%theta_dep
erro<-Y-X%*%theta_dep
sig0<-varcov.spatial(coords, cov.model = "sph", nugget = 0,
cov.pars = c(sill, phi))$varcov
sigma<-varcov.spatial(coords, cov.model = "sph", nugget = nugget,
cov.pars = c(sill, phi))$varcov
i.sig<-solve(sigma)
spatial.comp <- sig0%*%i.sig%*%erro
residuals<-erro - spatial.comp
comp.model<-cbind(trend,spatial.comp, residuals)

118

###################################################################
######
ANLISE DE UM DELINEAMENTO EM BLOCOS CASUALIZADOS
######
###################################################################
dados<-read.table("Exemplo.txt",sep=";", header=TRUE)
t=4
r=3

# nmero de tratamentos
# nmero de blocos

coords<-cbind(dados$CoordX, dados$CoordY)
############################################
##
exemplo do arquivo de entrada
##
##
de dados de um DBC com t=4 e r=3
##
##
##
##
CoordX CoordY trat bloco
y ##
## 1
0
0
1
1 24.47424 ##
## 2
1
0
1
2 19.82192 ##
## 3
2
0
1
3 20.56174 ##
## 4
0
1
2
1 25.91073 ##
## 5
1
1
2
2 22.77189 ##
## 6
2
1
2
3 23.97054 ##
## 7
0
2
3
1 26.25216 ##
## 8
1
2
3
2 25.88862 ##
## 9
2
2
3
3 26.42087 ##
## 10
0
3
4
1 29.91367 ##
## 11
1
3
4
2 26.52883 ##
## 12
2
3
4
3 26.53225 ##
############################################

### Construindo a matriz X ###


X1<-matrix(c(rep(1,r*t)),ncol=1)
X2<-kron(diag(t),c(rep(1,r)))
X3<-kron(c(rep(1,t)),diag(r))
X<-cbind(X1,X2,X3)

### Calculando o erro (anlise clssica) ###


Y<-c(dados$y)
theta<-ginv(t(X)%*%X)%*%t(X)%*%Y
erro<- data.frame(Y- X%*%theta)

119

### Anlise Geoestatstica ###


geodados <- as.geodata(data.frame(coords,erro),coords.col = 1:2,
data.col = 3)
geodados
h_max<- summary(geodados)[[3]][[2]]
dist<-0.5*h_max+2
vario.res <- variog(geodados)

### Envelope ###


geo.env <- variog.mc.env(geodados, obj.var = vario.res)
plot(vario.res, envelope = geo.env)

### Ajustando o modelo terico ###


plot(vario.res, xlim=c(0,dist))
ols<- variofit(vario.res,cov.model="sph", max.dist=dist)
lines(ols, col="red", lty=1, lwd=2)
phi<-summary(ols)[[10]][[3]]
# alcance
sill<-summary(ols)[[10]][[2]]
# contribuicao
nugget<-summary(ols)[[10]][[1]] # ef. pepita

### Obtendo a matriz de covariancias ###


sigma<-varcov.spatial(coords = coords, cov.model = "sph", nugget =
nugget, kappa = 0.5, cov.pars = c(sill,phi))$varcov
V<- sigma*(1/(as.numeric(sill+nugget)))
i.V<-solve(V)

### Iteraes ###


repeat
{
geodados <- as.geodata(data.frame(coords,erro),coords.col = 1:2,
data.col = 3)
vario.res <- variog(geodados,max.dist=dist)
ols<-variofit(vario.res, cov.model="sph", weights="equal",
max.dist=dist)
phi1<-summary(ols)[[10]][[3]]
sill1<-summary(ols)[[10]][[2]]
nugget1<-summary(ols)[[10]][[1]]

120

sigma<-varcov.spatial(coords = coords, cov.model = "sph", nugget =


nugget1, kappa = 0.5, cov.pars = c(sill1,phi1))$varcov
i.V<-solve(sigma*(1/(as.numeric(nugget1+sill1))))
theta_dep<-ginv(t(X)%*%i.V%*%X)%*%t(X)%*%i.V%*%Y
erro<- data.frame(Y- X%*%theta_dep)
e1=phi-phi1
e2=sill-sill1
e3=nugget-nugget1
phi=phi1
sill=sill1
nugget=nugget1
if ((e1<0.0001) && (e2<0.0001) && (e3<0.0001)) break
}

### Somas de quadrados ###


P1<-i.V%*%X1%*%solve(t(X1)%*%i.V%*%X1)%*%t(X1)%*%i.V
P<-i.V%*%X%*%ginv(t(X)%*%i.V%*%X)%*%t(X)%*%i.V
R<-i.V - P1
P2<-R%*%X2%*%ginv(t(X2)%*%R%*%X2)%*%t(X2)%*%R
SQtrat<-t(Y)%*%P2%*%Y
SQRes<-t(Y)%*%(i.V-P)%*%Y
SQT<-t(Y)%*%(i.V - P1)%*%Y
SQBloco<-t(Y)%*%(P-P1-P2)%*%Y
## Graus de liberdade ##
glt<-rk(i.V-P1)
glres<-rk(i.V-P)
gltrat<-rk(P2)
glbloco<-rk(P-P1-P2)

## Construindo a anlise de varincia


QMTrat<-SQtrat/gltrat
QMRes<-SQRes/glres
QMBloco<-SQBloco/glbloco
F.calc<-QMTrat/QMRes
F.calc2<-QMBloco/QMRes

121

pval<- 1-pf(F.calc,gltrat,glres)
pval2<- 1-pf(F.calc2,glbloco,glres)
anova<-data.frame(FV = c("Tratamento","Bloco","Residuo","Total"),
GL = c(gltrat,glbloco,glres,glt),
SQ=round(c(SQtrat,SQBloco,SQRes,SQT),3),
QM = c(as.character(round(c(QMTrat,QMBloco,QMRes),3))," "),
F = c(as.character(round(c(F.calc,F.calc2),3)), " ", " "),
Pvalue = c(as.character(round(c(pval,pval2),3)), " ", " "))
anova

### Anlise de varincia supondo erros independentes ###


reg<-lm(y~factor(trat)+factor(bloco),dados)
anova(reg)

### Obtendo os componentes do modelo espacial ###


theta_dep<-ginv(t(X)%*%i.V%*%X)%*%t(X)%*%i.V%*%Y
trend<-X%*%theta_dep
erro<-Y-X%*%theta_dep
sig0<-varcov.spatial(coords, cov.model = "gaus", nugget = 0,
cov.pars = c(sill, phi))$varcov
sigma<-varcov.spatial(coords, cov.model = "gaus", nugget = nugget,
cov.pars = c(sill, phi))$varcov
i.sig<-solve(sigma)
spatial.comp <- sig0%*%i.sig%*%erro
residuals<-erro - spatial.comp
comp.model<-cbind(trend,spatial.comp, residuals)

122

###############################################################
##############
Simulao de dados
#####################
###############################################################

### Simulao de um DIC com 15 trat. e 8 rep. ###


m=500

# nmero de simulaes

result<-data.frame(F.dep=rep(0,m),F.ind=rep(0,m),porc.F=rep(0,m),
phi=rep(0,m),sill=rep(0,m),nugget=rep(0,m))
t=15 # numero de tratamentos
r=8
# numero de repeties
v=15 # eixo y
u=8
# eixo x
model<-"sph"
eftrat<-c(7, 10, 5, 5, 8, 10, 9, 5, 10, 6, 7, 7, 6,
coords<- expand.grid(x= seq(0,(u-1),1),y=seq(0,(v-1),1))

6, 9)

X1<-matrix(c(rep(1,r*t)),ncol=1)
X2<-kron(diag(t),c(rep(1,r)))
X<-cbind(X1,X2)
for(k in 1:m)
{
dados<-data.frame(y=10, trat=rep(1:t, each=r))
for (i in 1:t)
dados$y[dados$trat==i]<dados$y[dados$trat==i] + eftrat[i]
## Gerando erros dependentes
dep<-GaussRF(coords,model=model, param=c(0,2.5,0,6))
dados$y<-dados$y + dep ## adicionando os erros aos efeitos fixos
Y<-c(dados$y)
theta<-ginv(t(X)%*%X)%*%t(X)%*%Y
erro<- data.frame(Y- X%*%theta)
### Anlise geoestatstica ###
geodados <- as.geodata(data.frame(coords,erro),coords.col = 1:2,
data.col = 3)
h_max<- summary(geodados)[[3]][[2]]
dist<-0.5*h_max+2

123

vario.res <- variog(geodados,max.dist=dist)


ols<-variofit(vario.res,cov.model=model,weights="equal",
max.dist=dist)
phi<-summary(ols)[[10]][[3]]
sill<-summary(ols)[[10]][[2]]
nugget<-summary(ols)[[10]][[1]]
sigma<-varcov.spatial(coords = coords, cov.model = model, nugget =
nugget,kappa = 0.5,cov.pars = c(sill,phi))$varcov
V<- sigma*(1/(as.numeric(nugget+sill)))
i.V<-solve(V)
theta_dep<-ginv(t(X)%*%i.V%*%X)%*%t(X)%*%i.V%*%Y
erro<- data.frame(Y- X%*%theta_dep)
### Iteraes ###
repeat
{
geodados <- as.geodata(data.frame(coords,erro),coords.col = 1:2,
data.col = 3)
vario.res <- variog(geodados,max.dist=dist)
ols<-variofit(vario.res, cov.model="sph", weights="equal",
max.dist=dist)
phi1<-summary(ols)[[10]][[3]]
sill1<-summary(ols)[[10]][[2]]
nugget1<-summary(ols)[[10]][[1]]
sigma<-varcov.spatial(coords = coords, cov.model = "sph", nugget =
nugget1, kappa = 0.5, cov.pars = c(sill1,phi1))$varcov
i.V<-solve(sigma*(1/(as.numeric(nugget1+sill1))))
theta_dep<-ginv(t(X)%*%i.V%*%X)%*%t(X)%*%i.V%*%Y
erro<- data.frame(Y- X%*%theta_dep)
e1=phi-phi1
e2=sill-sill1
e3=nugget-nugget1
phi=phi1
sill=sill1
nugget=nugget1
if ((e1<0.0001) && (e2<0.0001) && (e3<0.0001)) break
}

124

### Anlise considerando erros dependentes ###


P1<-i.V%*%X1%*%solve(t(X1)%*%i.V%*%X1)%*%t(X1)%*%i.V
P<-i.V%*%X%*%ginv(t(X)%*%i.V%*%X)%*%t(X)%*%i.V
QMTrat_dep<-t(Y)%*%(P-P1)%*%Y/rk(P-P1)
QMRes_dep<-t(Y)%*%(i.V-P)%*%Y/rk(i.V-P)
F.dep<-QMTrat_dep/QMRes_dep

### Anlise considerando erros independentes


reg<-lm(y~factor(trat),dados)
QMTrat_ind<-anova(reg)[[3]][1]
QMRes_ind<-anova(reg)[[3]][2]
F.ind<-anova(reg)[[4]][1]

###

### Porcentagem de aumento do valor F ao considerar dependncia ###


porc.F<-as.numeric(100*F.dep/F.ind -100)
result[k,]<-c(F.dep,F.ind,porc.F,phi,sill,nugget)
}
result

Вам также может понравиться