Академический Документы
Профессиональный Документы
Культура Документы
Piracicaba
2016
Viviane Panariello Paulenas
Engenheira Agrnoma
Orientador:
Prof. Dr. SNIA MARIA DE STEFANO PIEDADE
Piracicaba
2016
Dados Internacionais de Catalogao na Publicao
DIVISO DE BIBLIOTECA - DIBD/ESALQ/USP
CDD 633.15
P326a
Permitida a cpia total ou parcial deste documento, desde que citada a fonte O autor
3
Dedicatria
aaa
5
AGRADECIMENTOS
A Deus pelo dom da vida, por me iluminar e pela oportunidade de concluir mais esta
nova etapa.
Aos meus pais, Bruno e Eliana, s minhas irms Mariana e Paula, minha querida av
Carmen Aparecida (Zita), aos meus padrinhos Angela e Sidney e a toda a minha famlia, pelo
incentivo, pelos abraos calorosos, pelo amor e pela compreenso nos momentos de ausncia.
Ao meu av Paulo (in memorian), que infelizmente no pode acompanhar esta conquista at o
fim, mas que ficaria muito feliz em v-la concluda.
Escola Superior de Agricultura Luiz de Queiroz, seus professores e funcionrios,
pela estrutura e oportunidade oferecidas e por tantos anos de acolhimento.
querida Professora Snia Maria De Stefano Piedade pela orientao, confiana, pela
amizade e por sempre irradiar seu amor pela nossa Gloriosa ESALQ por onde quer que passe.
querida Professora Renata Alcarde Sermarini pelas sugestes, pelos esclarecimentos
prestados e principalmente pela ateno.
Aos Professores do Programa de Ps-Graduao em Agronomia - Estatstica e Experi-
mentao Agronmica, por compartilharem seus conhecimentos.
Ao Prof. Cludio Lopes de Souza Jnior do Departamento de Gentica pelas sugestes e
pela concesso dos dados experimentais sem os quais eu no teria a oportunidade da aplicao.
doutoranda Melina Andrade pela intermediao.
s secretrias Solange Sabadin e Luciane Brajo por todas as informaes e esclareci-
mentos oferecidos, alm de todo apoio e ateno.
Aos funcionrios do Departamento de Cincias Exatas, Mayara, Eduardo, Jorge e Rosni
pelo suporte e Tina, por manter a ordem e a limpeza dos ambientes de estudo.
Aos colegas de turma Csar Jotta pelo papo descontrado, ao Christopher Silva de Pdua
por me ajudar a desvendar os segredos do LATEX, R em geral, pela amizade e companhia nas
gordices, Gislaine Pereira pelas conversas e incentivo, Luiza Barros pelo incentivo na fase
final da dissertao, Mara Fatoretto pela amizade e por me ajudar a entender vrios conceitos
estatsticos e por ltimo, mas no menos importante, meu amigo Vincius Menarin (Polaco)
pelas valiosas ajudas em R, LATEX, Excel e pela amizade.
querida Alessandra dos Santos pela sugesto do tema do trabalho, pela amizade e
competncia. Mesmo estando na Austrlia, no deixou de me auxiliar na realizao deste trabalho.
Natlia Martins que me deu todo o apoio para que eu regressasse aos estudos, Natalie
Rondinel pelo material e valiosa ajuda.
6
Ao amigo de longa data Victor Augusto Forti por me mostrar os encantos da Estatstica
na Agronomia.
Aos funcionrios da Diviso de Biblioteca e Documentao da ESALQ pela estrutura
e por todo o apoio nas buscas bibliogrficas em especial Thais Cristiane Campos de Moraes
pelos sorrisos amistosos e pela constante disposio em me ajudar.
Aos amigos do G9, Andr Colao, Camila Ortiz, Diego Chiou, Erik Barreto Jr., Heitor
Arakawa, Larissa Pagliuca, Leonardo Bordin e Mnica Georgino pelos churrascos, momentos de
descontrao e incentivo constante.
s meninas do F5, Alessandra e rica da Paz, Marisol Bandeira, Mnica Georgino e
Natlia Lovadino pelos bons momentos juntas e pelo carinho.
Ao Alcides Jnior que esteve presente uma boa parte do caminho mas que nunca deixou
de me incentivar.
Coordenao de Aperfeioamento de Pessoal de Nvel Superior - CAPES, pela
concesso da bolsa de estudos.
Queridos jovens: se queremos que nossa vida tenha realmente sentido e plenitude, digo a cada
um e a cada uma de vocs: bote f e a vida ter um sabor novo, ter uma bssola que indica a
direo; bote esperana e todos os seus dias sero iluminados e o seu horizonte j no ser
escuro, mas luminoso; bote amor e a sua existncia ser como uma casa construda sobre a
rocha, o seu caminho ser alegre, porque encontrar muitos amigos que caminham com voc.
Bote f, bote esperana, bote amor!
Papa Francisco
8
9
SUMRIO
RESUMO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
ABSTRACT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
LISTA DE ILUSTRAES . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
LISTA DE TABELAS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1 INTRODUO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2 REVISO BIBLIOGRFICA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.1 Melhoramento gentico vegetal da cultura do milho . . . . . . . . . . . . . . . . . 21
2.2 Delineamentos em blocos incompletos . . . . . . . . . . . . . . . . . . . . . . . . 22
2.3 Delineamentos ltices quadrados ou reticulado quadrado . . . . . . . . . . . . . . 23
2.3.1 Ltice quadrado balanceado . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.3.2 Ltice quadrado parcialmente balanceado . . . . . . . . . . . . . . . . . . . . . 24
2.3.2.1 Construo do delineamento ltice quadrado . . . . . . . . . . . . . . . . . . 25
2.3.3 Anlises estatsticas convencionais para delineamentos em ltice quadrado . . . . 25
2.3.4 Anlises individuais e conjuntas . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.4 Modelos lineares mistos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.4.1 Estimao dos componentes de varincia . . . . . . . . . . . . . . . . . . . . . 31
2.4.1.1 Mtodo dos mnimos quadrados - ANOVA . . . . . . . . . . . . . . . . . . . 33
2.4.1.2 Mtodo da Mxima Verossimilhana . . . . . . . . . . . . . . . . . . . . . . 33
2.4.1.3 Mtodo da Mxima Verossimilhana Restrita . . . . . . . . . . . . . . . . . . 34
2.4.1.4 Predio do efeitos aleatrios . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4.2 Seleo de modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4.2.1 Teste da Razo de Verossimilhana . . . . . . . . . . . . . . . . . . . . . . . 36
2.5 Herdabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3 MATERIAL E MTODOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.1 Material . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Mtodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.3 Especificao dos modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3.1 Anlise convencional como ltice quadrado . . . . . . . . . . . . . . . . . . . . 42
3.3.1.1 Anlises individuais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3.1.2 Anlises conjuntas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.3.2 Anlise considerando repetio como um bloco completo . . . . . . . . . . . . . 43
3.3.2.1 Anlises individuais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.3.2.2 Anlise conjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
4 RESULTADOS E DISCUSSO . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.1 Anlise descritiva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.2 Coeficiente de determinao fenotpico entre valores observados e preditos . . . . . 46
10
RESUMO
ABSTRACT
Experiments conducted in the lattice design are quite common in plant breeding in which
several genetic materials are compared, especially in the early stages of the program, aiming to
explore more intensively the genetic variability available. In situations of space and financial
constraints these designs stand out for allowing the comparison of all progenies being tested
whether or not installed in the same block. The aim of the study was the evaluation of maize
(Zea mays L.) progeny tests in different environments for grain yield in t.ha1 . Two hundred and
fifty six progenies were tested in four experimental stations in the city of Piracicaba, in different
agricultural years. Grain production data obtained by different environments were analyzed
individually and jointly in order to verify the presence of genotype environment interaction.
Therefore, the square lattice design with dimension 16 16 was used with two replications in
each location. Two experimental approaches were compared, considering the partially balanced
incomplete block structure of the lattice and the other in each repetition of the lattice was analyzed
as if it were a complete block. One way to analyze experimental structures like this is with the use
of mixed models, by adding random effect factors, and by making use of the restricted maximum
likelihood (REML) for estimating the variance components associated with such factors with less
bias. Besides the variance components, EBLUPs (empirical best linear predictor unbiased) were
also calculated and from them was checked the correlation between the different environments,
and the percentage of selected progenies comparing the results obtained by the two assembly
approaches data. Statistical analyzes were implemented for the open-souce software R, using the
statistical package lme4.
Keywords: Square lattice design; Mixed models; Restricted maximum likelihood (REML);
EBLUP; Zea mays L.; Correlation
14
15
LISTA DE ILUSTRAES
LISTA DE TABELAS
1 INTRODUO
faixa de condies ambientais. Isto acontece devido possibilidade de se analisar a interao dos
gentipos com os ambientes que, ao ser quantificada corretamente, pode ser revertida em favor
da maximizao das produtividades da cultura (LEITE, 2011).
Uma outra abordagem possvel quando se instala um experimento em ltice quadrado a
possibilidade de realizar a anlise em blocos casualizados, na qual cada repetio do ltice
considerada com um bloco casualizado completo. Essa modalidade de anlise j foi testada por
Paterniani (1968), Silva (1997), Rios (1997) e Cecon (1992), apresentando preciso satisfatria
nos testes estatsticos e nas estimativas dos componentes de varincia.
A produo de gros de milho o principal carter de interesse, tanto para melhoristas
como para agricultores. Trata-se de um carter quantitativo, controlado por um grande nmero
de locos (JUGENHEIMER, 1976; PATERNIANI; VIEGAS, 1987), que possuem pequeno efeito
individual sobre o fentipo (COMSTOCK, 1978), fazendo com que sua expresso sofra acentuado
efeito do ambiente (MORO et al., 2012).
Os objetivos deste trabalho so, portanto:
i) fazer uma reviso das possveis anlises de experimentos em ltice quadrado e da anlise deles
via metodologia de modelos mistos com enfoque no melhoramento gentico;
ii) estimar os componentes de varincia e, consequentemente, predizer os EBLUPs para o carter
produo de gros via mtodo da mxima verossimilhana restrita por meio de duas abordagens,
considerando a estrutura do ltice quadrado e tomando-se cada repetio do ltice como se fosse
um bloco completo;
iii) comparar a ordenao dos EBLUPs das prognies entre ambientes e pelas duas abordagens
com a ajuda de grficos de correlao e da contagem das melhores prognies selecionadas
comparando-se os ambientes entre si.
21
2 REVISO BIBLIOGRFICA
O milho (Zea mays L.) em funo de seu potencial produtivo, composio qumica e valor
nutritivo, constitui-se em um dos mais importantes cereais cultivados e consumidos no mundo.
Devido sua multiplicidade de aplicaes, quer na alimentao humana quer na alimentao
animal, assume relevante papel socioeconmico, alm de ser indispensvel matria-prima
impulsionadora de diversificados complexos agroindustriais (FANCELLI; DOURADO-NETO,
2004). uma espcie da famlia das gramneas e um dos cereais mais cultivados no planeta. A
cultura est disseminada numa vasta regio do globo, em altitudes que vo desde o nvel do mar
at 3 mil metros.
Segundo Paterniani e Viegas (1987), a mais antiga espiga de milho foi encontrada no
vale do Tehucan, na regio onde hoje se localiza o Mxico, datada de 7.000 a.C. O Teosinte ou
alimento dos deuses, como era chamado pelos maias, deu origem ao milho por meio de um
processo de seleo artificial (feito pelo homem). Ao longo do tempo, o homem promoveu uma
crescente domesticao do milho por meio da seleo visual no campo, considerando importantes
caractersticas, tais como produtividade, resistncia a doenas e capacidade de adaptao, dentre
outras.
A partir do incio do sculo XX, vrios programas de melhoramento gentico usando
bases cientficas foram iniciados. O desenvolvimento de linhagens, oriundas do processo de
autofecundao das plantas de milho por vrias geraes, e do vigor hbrido, ou heterose, foram
os responsveis pelo impulso que o melhoramento gentico convencional tomou no incio do
sculo passado. Esse conhecimento permitiu que os programas de melhoramento conseguissem
introduzir novas caractersticas ao milho como resistncia a doenas e pragas, maior resposta s
prticas de manejo e menor tombamento e quebramento de plantas. Esse conjunto de melhorias
fez com que o milho se adaptasse a diferentes regies, condies de clima, solo e finalidade de
uso.
Os efeitos do melhoramento podem ser vistos tambm no aumento da produtividade
mdia nacional. De 2622 kg.ha1 na safra 94/95, a produtividade mdia nacional saltou para
5396 kg.ha1 em 2014/2015. So 2774 kg.ha1 de aumento na produtividade em apenas 20
anos. Considerando que 50% desse aumento foi devido ao melhoramento gentico e os outros
50% devido s melhorias nas condies de cultivo, so, em mdia, 69,3 kg.ha1 .ano1 de
contribuio do melhoramento, de acordo com dados da CONAB (COMPANHIA NACIONAL
DE ABASTECIMENTO, 2016). Nos ltimos anos, a rea de cultivo de milho no Brasil tem sido
de, aproximadamente, 10 milhes de hectares.
22
O milho uma das culturas mais importantes mundialmente, seja do ponto de vista
econmico, seja do ponto de vista social. Destaca-se por ser o gro mais produzido no mundo:
segundo informaes do UNITED STATES DEPARTMENT OF AGRICULTURE - USDA
(2016), a produo mundial deste cereal dever atingir 989,83 milhes de toneladas na safra
agrcola 2015/16. importante destacar que, entre as safras 2004/05 e 2014/15, a produo
mundial de milho registrou um crescimento de 38,4%. Este forte incremento ocorreu para atender
necessidade de abastecer a demanda, que registrou uma expanso de 41%, no mesmo perodo.
O milho tambm se destaca como o gro mais consumido do mundo: estima-se que, na safra
2014/15, seu consumo alcance 971,2 milhes de toneladas (SOLOGUREN, 2015).
nmero de tratamentos e qualquer tamanho de blocos, com o mesmo de nmero de parcelas por
bloco. Esses dois parmetros fixam o nmero mnimo de repeties necessria para o equilbrio.
Esse mnimo frequentemente grande para o delineamento balanceado ter um significado prtico
(PETERSEN, 1994).
Os delineamentos balanceados nem sempre so prticos, por isso uma classe de deline-
amentos chamada blocos incompletos parcialmente balanceados foi desenvolvida por Bose e
Nair (1939). Na mais til delas, alguns pares de tratamentos ocorrem juntos no mesmo bloco
1 vezes, e outros pares ocorrem juntos 2 vezes, onde 1 e 2 so nmeros inteiros. Embora
os delineamentos parcialmente balanceados sejam mais teis em termos prticos, eles no so
to desejveis como os modelos balanceados, por serem estatisticamente difceis de analisar. As
comparaes entre alguns pares de tratamentos so feitas com maior preciso do que para outros
pares.
Cochran e Cox (1957) classificam os BIB e BIPB em cinco tipos:
Tipo II - quando os blocos no podem ser arranjados em repeties, mas podem ser
agrupados formando grupos de repeties;
Tipo III - quando os blocos no podem ser agrupados formando repeties e nem mesmo
em grupos de repeties de tratamentos;
delineamentos diferem uns dos outros principalmente no nmero de repeties exigidas pelos
delineamentos. Quando um delineamento em blocos incompletos constitudo de duas ou mais
repeties completas, foi demonstrado que o delineamento pode ser analisado como se fosse um
bloco casualizado comum. Consequentemente a separao em blocos pode ser ignorada sem
destruir a validade da anlise mesmo que a preciso possa ser reduzida.
Existem vrios tipos de delineamentos reticulados. Estes incluem, em geral, reticulados
balanceados e reticulados parcialmente balanceados. Nos reticulados balanceados cada tratamento
ocorre junto no mesmo bloco com qualquer outro tratamento o mesmo nmero de vezes. No
entanto, se houver k blocos, deve haver (k + 1) repeties para ser balanceado. Isso est alm dos
recursos da maioria dos programas de melhoramento, devido a restries espaciais e financeiras.
Quando, ao contrrio, o nmero r de repeties ortogonais inferior a (k + 1), h pares de
tratamentos que ocorrem no mesmo bloco uma s vez, so os primeiros associados e h outros
em que isso no ocorre em nenhum bloco, e estes so os segundos associados.
Nos delineamentos ltices parcialmente balanceados o nmero de repeties reduzido,
mas nem todos os tratamentos ocorrem juntos em um mesmo bloco. Isto leva a uma diferena na
preciso com que algumas comparaes so feitas em relao a outras comparaes. No entanto,
a reduo do nmero de repeties faz com que o experimento seja possvel para a maioria dos
programas de melhoramento gentico, proporcionando a possibilidade de aumento da preciso
associada com blocos menores (PETERSEN, 1994).
de anlise de blocos causalizados. A anlise como blocos casualizados se faz considerando que
cada uma das repeties um bloco completo casualizado. Essa anlise no leva em conta a
provvel heterogeneidade dos blocos e, portanto, fornece, em geral, um maior quadrado mdio
do resduo. Diante da maior facilidade atual em modelar os dados de uma maneira mais realista
e eficiente, esta anlise deve ser preterida, a no ser para o clculo da eficincia do ltice
(PIMENTEL-GOMES, 2009).
Uma outra maneira a anlise intrablocos dos ltices que se baseia no tradicional mtodo
dos quadrados mnimos, tal como o que feito para os delineamentos inteiramente casualizados
ou em blocos completos casualizados. Silva, Ferreira e Pacheco (2000) demonstraram ser a anlise
intrablocos a melhor para estimao de componentes de varincia sempre que a eficincia relativa
do delineamento em ltice, em relao ao delineamento em blocos casualizados, for superior
a 100% e, em caso contrrio, deve-se optar pelo modelo de anlise em blocos casualizados
completos. Na anlise intrablocos apenas comparaes entre parcelas do mesmo bloco so usadas
nas estimativas de efeito de tratamentos.
As formas de anlise discutidas at agora estimam os efeitos de tratamentos tendo por
base apenas sua prpria informao, contida nos blocos onde aparece. Yates (1939), tendo como
base o fato da no ortogonalidade dos delineamentos BIB, por no conterem os blocos todos
os tratamentos, props uma nova forma de analisar esse tipo de experimento, de modo que os
efeitos de tratamentos contidos nos blocos pudessem ser recuperados. Isso se chama anlise com
recuperao da informao interblocos.
A anlise intrablocos pode ser usada para qualquer experimento em blocos incompletos e
se baseia em mtodos estatsticos exatos. A anlise com recuperao da informao interblocos, por
outro lado, permite aproveitar melhor os dados, mas usa mtodos estatsticos apenas aproximados
e s deve ser usada para experimentos com nmero de graus de liberdade relativamente grande
para blocos e para o resduo (PIMENTEL-GOMES; GARCIA, 2002).
(1995) entre outros, estudaram a anlise conjunta de experimentos. Este tipo de anlise tambm
de grande interesse para os melhoristas de plantas, pois, segundo Ramalho (1977), as estimativas
de parmetros genticos baseadas em experimentos conduzidos em um nico ambiente so
superestimadas. Isto ocorre devido ao fato de que, alm do componente gentico, h o componente
da interao gentipo-ambiente envolvido nestas estimativas (REGAZZI et al., 1999). A deteco
e estimativa da interao gentipo por ambiente, e o conhecimento da existncia desta interao
de primordial importncia no processo de seleo de novos hbridos, pois esta interao pode
mascarar a performance mdia de um indivduo ou linhagem na anlise conjunta em vrios
ambientes (SOLFERINI, 2010).
A interao gentipo ambiente foi definida por Dessotti et al. (2013) como sendo o
comportamento diferencial de gentipos em diferentes ambientes. Conclui-se com isso que os
efeitos genticos e ambientais no so independentes, uma vez que as respostas fenotpicas dos
gentipos podem diferir com as variaes ambientais (SOUZA-JNIOR; VENCOVSKY, 1989).
A resposta diferenciada dos gentipos aos vrios ambientes, conhecida como interao
gentipo ambiente um fenmeno natural que faz parte da evoluo das espcies. Segundo
Vencovsky e Barriga (1992), a interao gentipo ambiente de natureza gentica, mas no
no sentido usual, e sim da decorrncia de instabilidades das manifestaes genotpicas entre
ambientes. O comportamento dos gentipos em relao ao ambiente tem merecido especial
ateno, devido a sua interferncia nos processos de seleo. Por esta razo, torna-se importante
o conhecimento dessas interaes, principalmente a sua aplicao nos estudos de estabilidade
fenotpica das espcies.
A interao gentipo ambiente de extrema importncia nos programas de melhora-
mento, pois torna possvel a seleo de gentipos com adaptao ampla ou especfica, a escolha
de locais de seleo e a determinao do nmero ideal de ambientes e de gentipos a serem
avaliados (zonas de melhoramento) durante a seleo (KEMPTON; FOX; CEREZO, 1997).
Se existem interaes significativas envolvendo o fator tratamento, por exemplo, entre
tratamento e local, a recomendao usual a de fazer e relatar anlise separadamente para cada
local. Esta abordagem claramente faz concluses individuais para cada local (MOORE; DIXON,
2015).
y = X + Z u + i, (1)
em que:
y o vetor das observaes;
X a matriz de incidncia dos efeitos fixos;
o vetor de parmetros de efeitos fixos a serem estimados;
Z a matriz de incidncia dos efeitos aleatrios;
29
u o vetor de parmetros de efeito aleatrio a serem preditos tal que u N (0, G);
o vetor de erros aleatrios, associados a cada observao tal que N (0, ) sendo que e
u so independentes.
As dimenses dessas matrizes e vetores dependem do delineamento experimental
empregado.
Matricialmente, o modelo (1) dado por
y X Z 0
0 1
1 1 1
u 1
y2 X 2 0 Z 2 0 + 2 .
y = . = .
.. .. .. .. .. .. u 2 ...
. . . . . . .
yn X n 0 0 Z n n
un
Y |u N X + Z u, ,
u N (0, G) .
y
*. X Z GZ + Z G +/
0
u N .. 0 , GZ 0 G // i,
, 0 -
em que:
0 um vetor nulo;
uma matriz nula;
G a matriz de varincias e covarincias dos efeitos aleatrios presente no vetor u;
a matriz de varincias e covarincias dos resduos.
30
f g
1 1
(yX Z u) 0 1 (yX Z u) 1 1
u 0 G1 u
f ( y, u) = 1/2
e 2 1/2
e 2 i.
(2) n/2 || (2) n/2 |G|
1 1 1 0 1
L = 2nlog(2) log|| + log|G| y y 2y 01 X 2y 01 Z u +
2 2 2
+20 X 01 Z u + 0 X 01 X + u0 Z 01 Z u + u0 G1 ui.
L
X 01 y + X 01 X + X 01 Z u
= 0 1 1
i.
L Z y Z X + Z Z u + G u
0 1 0 1
u
Igualando-se tais derivadas a zero obtm-se:
0 1
X 01 X + X 01 Z u = X y i.
Z X + Z Z u + G u Z 01 y
0 1 0 1 1
Dessa forma, a soluo conjunta para os efeitos fixos e aleatrios, segundo (HENDERSON,
1984) dada a partir do seguinte sistema de equaes:
0 1 0 1
X X X 01 Z = X y i.
Z 01 X Z 01 Z + G1 u Z 01 y
1 1 1
= X 0 1 1 Z Z 0 1 Z + G1 Z 0 1 X X 0 1 1 Z Z 0 1 Z + G1 Z 0 1 y
e
1
u = Z 01 Z + G1 Z 01 y X i.
i) A soluo obtida pelas equaes de modelo misto uma soluo de mnimos quadrados
generalizados, ou seja,
= X 0V 1 X X 0V 1 yi,
1
em que: V 1 = 1 1 Z Z 01 Z + G1 Z 01 Z 01 .
ii) A varincia de dada por:
0 1 0 1 0 1 1 1 0 1
Var = X X X Z Z Z + G Z X .
1 1
Var( u) = GZ 0 1 1 Z Z 0 1 Z + G1 Z 0 1 1 1 Z Z 0 1 Z + G1 Z 0 1
1 1
X X 0 1 1 Z Z 0 1 Z + G1 Z 0 1 X X 0 1 1 Z Z 0 1 Z + G1 Z 0 1 Z G 0 .
1 1
Var(u u) = G GZ 0 1 1 Z Z 0 1 Z + G1 Z 0 1 1 1 Z Z 0 1 Z + G1 Z 0 1
1 1
X X 0 1 1 Z Z 0 1 Z + G1 Z 0 1 X X 0 1 1 Z Z 0 1 Z + G1 Z 0 1 Z G 0 .
Deve-se observar que o uso das equaes de modelo misto, requer o conhecimento
prvio das varincias e covarincias (G e ) envolvidas no modelo (SEARLE; CASELLA;
MCCULLOCH, 2006). Esses parmetros geralmente so desconhecidos, e o que se tem feito
substitu-los por suas estimativas.
E(Y ) = E * + = * +
Y 1
,Y 2 - , 0 -
e
L01 L 1 L01 L 2 +
Var(Y ) = Var * + = * 0
Y 1
i.
,Y 2 - , L 2 L 1 L02 L 2 -
1
= X 01 X X 01Yi.
u = U Z 01 Y X i,
tal que N , (X 01 X ) 1 e o BLUP equivalente a E[u|Y ] sob suposio de normalidade
multivariada. Para obteno dos resultados um mtodo iterativo necessrio e s vezes o processo
computacional pode ser intenso caso exista um grande nmero de parmetros e/ou observaes.
As equaes REML com dados balanceados so idnticas aos estimadores ANOVA que
so no viesados e de varincia mnima. O estimador REML leva em conta os graus de liberdade
envolvidos nas estimativas dos efeitos fixos, ao passo que os estimadores ML no. No caso de
dados no balanceados os estimadores ML e os estimadores REML so viesados (SEARLE;
CASELLA; MCCULLOCH, 2006).
35
4. Suficincia, tal que o preditor condene o mximo possvel a informao contida na amostra
e no seja funo dependente do parmetro;
6. Invarincia a translao, tal que a estimao dos componentes de varincia no seja afetada
por mudanas nos efeitos fixos.
paramtricos das variveis so substitudos por suas estimativas (IEMMA, 2003). Para tanto
foram usadas estimativas dessas varincias pelo mtodo da mxima verossimilhana restrita
(REML), usando um processo iterativo baseado no algoritmo EM (Expectation-Maximization)
(DEMPSTER; N.M.; D.B., 1977), ou de maximizao da esperana (HENDERSON, 1984).
O algoritmo EM estvel numericamente, apresentando convergncia mesmo que os
valores inicias no tenham sido adequados. Entretanto, uma inconvenincia do algoritmo EM,
a lentido para estimativas prximas ao limite do espao paramtrico (RESENDE et al., 1996).
Os algoritmos livres de derivadas (derivative-free) apresentam vantagens computacionais, pois
evitam a inverso de matrizes de ordem elevada. Os estimadores obtidos pelo EM so idnticos
aos de Harville (1977). Se valores positivos forem inicialmente utilizados, a convergncia para
valores no negativos garantida (HARVILLE, 1977).
Quando deseja-se comparar os valores das funes de verossimilhana para dois modelos
aninhados, o teste de razo de verossimilhanas indicado. No contexto dos modelos lineares
mistos, o teste da razo de verossimilhanas pode ser empregado para testar hipteses sobre
parmetros de covarincia ou parmetros de efeito fixo, no contexto de modelos lineares mistos.
A estatstica do teste calculada por:
!
L2
2log = 2 log(L 2 ) log(L 1 ) i,
L1
2.5 Herdabilidade
3 MATERIAL E MTODOS
3.1 Material
P1 : F2 P1 : F2:3
L14-04B
P2 : F2 P2 : F2:3
F1 F2
..
.
L08-05F
P256 : F2 P256 : F2:3
Figura 1 Esquema para a obteno das 256 plantas e populaes utilizadas, em que as letras L, F e P representam
linhagem, gerao filial e planta respectivamente; representa cruzamento entre as linhagens e
representa a autofecundao das prognies
Adaptado de Coelho (2010).
40
3.2 Mtodos
O modelo matemtico considerado misto, pois possui efeitos aleatrios, alm do efeito
fixo relativo mdia geral.
42
y = Xg + Zr + Zr b + Z p + (2)
em que:
y o vetor de dados fenotpicos, de dimenso n 1, em que, n o nmero de observaes;
X g a matriz de incidncia do efeito da mdia geral, de dimenso n 1;
uma constante inerente a todas as observaes;
Z r a matriz de incidncia dos efeitos de repeties, de dimenso n 2;
o vetor dos efeitos de repeties (aleatrios), de dimenso 2 1;
Z r b a matriz de incidncia dos efeitos de blocos dentro de repeties, de dimenso n 16;
o vetor dos efeitos de blocos dentro de repeties (aleatrios), de dimenso 16 1;
Z p a matriz de incidncia dos efeitos genotpicos, de dimenso n 256;
o vetor dos efeitos genotpicos (aleatrios), de dimenso 256 1;
o vetor de erros, de dimenso n 1, sendo que N (0, R) e R = I 2 , em que, I uma
matriz identidade de dimenso n n e 2 o erro experimental.
y = X g + Z a + Z ar + Z ar b + Z p + Z l p + (3)
em que:
y o vetor de dados fenotpicos, de dimenso n 1, em que, n o nmero de observaes;
X g a matriz de incidncia do efeito da mdia geral de dimenso n 1;
uma constante inerente a todas as observaes;
Z a a matriz de incidncia dos efeitos de ambientes, de dimenso n 4;
o vetor dos efeitos de ambientes (aleatrios), de dimenso 4 1;
Z a r a matriz de incidncia da interao ambiente e repetio, de dimenso n (4 2);
o vetor dos efeitos de repetio (aleatrios), de dimenso 2 1;
43
y = Xg + Zr + Z p + (4)
em que:
y o vetor de dados fenotpicos, de dimenso n 1, em que, n o nmero de observaes;
X g a matriz de incidncia do efeito da mdia geral, de dimenso n 1;
uma constante inerente a todas as observaes;
Z r a matriz de incidncia dos efeitos de repeties, de dimenso n 2;
o vetor dos efeitos de repeties (aleatrios), de dimenso 2 1;
44
y = X g + Z a + Z ar + Z p + Z a p + (5)
em que:
y o vetor de dados fenotpicos, de dimenso n 1, em que, n o nmero de observaes;
X g a matriz de incidncia do efeito da mdia geral, formadas por valores 1, de dimenso n 1;
uma constante inerente a todas as observaes;
Z a a matriz de incidncia dos efeitos de ambientes, de dimenso n 4;
o vetor dos efeitos de ambientes (aleatrios), de dimenso 4 1;
Z a r a matriz de incidncia da interao ambiente e repetio, de dimenso n (4 2);
o vetor dos efeitos de repetio (aleatrios), de dimenso 2 1;
Z p a matriz de incidncia dos efeitos genotpicos, de dimenso n 256;
o vetor dos efeitos genotpicos (aleatrios), de dimenso 256 1;
Z a p a matriz de incidncia da interao ambiente e prognies, de dimenso 256 4;
o vetor dos efeitos da interao aleatria entre ambiente e prognies, de dimenso 4 1;
o vetor de erros, de dimenso n 1, sendo que N (0, R) e R = I 2 , em que, I uma
matriz identidade de dimenso n n e 2 o erro experimental.
Foram comparadas tambm as ordenaes das prognies pelos dois mtodos empregados,
realizando-se a seleo truncada de 5, 10, 15 e 20% das prognies, o que corresponde seleo
de 13, 26, 39 e 52 prognies respectivamente. A percentagem de coincidncia na seleo foi
obtida por meio do nmero de prognies selecionadas em comum entre os dois mtodos.
45
4 RESULTADOS E DISCUSSO
de variao for maior do que 20%, considerado alto, todavia todos os valores obtidos esto
dentro dos limites aceitveis na experimentao agronmica (SCAPIM; CARVALHO; CRUZ,
1995; FRITSCHE-NETO, 2008).
A anlise conjunta dos materiais genticos foi realizada com os 11 ambientes, uma
vez que a razo entre o maior e o menor componente de varincia residual foi inferior a sete
(PIMENTEL-GOMES, 2009). Considerando-se todos os ambientes, a mdia geral da produo
de gros foi de 4,03 t.ha1 e o coeficiente de variao foi 19,92%, ndice considerado aceitvel
para experimentos de campo.
Tabela 3 Coeficiente de determinao fenotpico entre os valores observados e os preditos pelos modelos nas
anlises individuais e conjuntas
LTICE DBC
Ambiente R2 (%) Ambiente R2 (%)
AN0203 0,92 AN0203 0,91
AR0203 0,94 AR0203 0,91
CA0203 0,94 CA0203 0,93
ES0203 0,91 ES0203 0,89
AN0304 0,94 AN0304 0,90
CA0304 0,94 CA0304 0,93
ES0304 0,95 ES0304 0,92
AN0506 0,95 AN0506 0,95
ES0506 0,95 ES0506 0,94
AN0607 0,94 AN0607 0,92
ES0607 0,93 ES0607 0,90
Conjunta 0,96 Conjunta 0,95
Nas anlises individuais para o carter produo de gros, foram obtidos os seguintes
componentes de varincia por ambiente (Tabela 4), juntamente de seus respectivos intervalos
de confiana a 95% e do coeficiente de herdabilidade, de acordo com o modelo descrito pela
equao (2).
Tabela 4 Estimativa dos componentes de varincia das anlises individuais por ambiente, com os respectivos
intervalos de confiana a 95% e do coeficiente de herdabilidade considerando-se a estrutura do ltice
quadrado
A anlise conjunta foi realizada segundo o modelo descrito pela equao (3). Os
componentes de varincia obtidos constam na tabela 5, juntamente de seus respectivos intervalos
de confiana a 95% e do coeficiente de herdabilidade.
Tabela 5 Estimativa dos componentes de varincia da anlise conjunta, com os respectivos intervalos de confiana
a 95% e do coeficiente de herdabilidade considerando-se a estrutura do ltice quadrado
4.4 Diagnsticos
Figura 2 Resduos condicionais das anlises individuais em cada um dos ambientes - estrutura ltice
51
Figura 3 Resduos condicionais das anlises individuais em cada um dos ambientes - estrutura de blocos completos
52
Figura 4 Comparao das mdias de tratamentos em relao aos EBLPs obtidos aps ajuste do modelo - estrutura
ltice
53
Figura 5 Comparao das mdias de tratamentos em relao aos EBLPs obtidos aps ajuste do modelo - estrutura
de blocos completos
54
Figura 6 Resduos condicionais das anlises individuais dos em cada um dos ambientes - estrutura ltice
55
Figura 7 Resduos condicionais das anlises individuais em cada um dos ambientes - estrutura de blocos completos
56
4.5 Ordenao e seleo das prognies obtidos a partir da predio dos efeitos aleatrios
Tabela 8 Porcentagem das prognies coincidentes entre ambientes ao selecionar 5, 10, 15 e 20% das prognies
mais produtivas nas anlises individuais e conjunta como ltice
Tabela 9 Porcentagem das prognies coincidentes entre ambientes ao selecionar 5, 10, 15 e 20% das prognies
mais produtivas nas anlises individuais e conjunta como blocos casualizados completos
Tabela 10 Porcentagem das prognies coincidentes entre ambientes ao selecionar 5, 10, 15 e 20% das prognies
mais produtivas pelas duas abordagens de anlise individuais
4.5.1 Correlao entre os EBLUPs obtidos por ambiente nas diferentes estruturas de
anlise
Figura 8 Correlao de Spearman entre os EBLUPs obtidos pelo modelo em cada um dos ambientes nas anlises
individuais considerando-se a estrutura do ltice quadrado
Figura 9 Correlao de Spearman entre os EBLUPs obtidos pelo modelo em cada um dos ambientes nas anlises
conjuntas considerando-se a estrutura do ltice quadrado
61
Figura 10 Correlao de Spearman entre os EBLUPs obtidos pelo modelo em cada um dos ambientes nas anlises
individuais considerando-se a estrutura de blocos completos
Figura 11 Correlao de Spearman entre os EBLUPs obtidos pelo modelo em cada um dos ambientes nas anlises
conjuntas considerando-se a estrutura de blocos completos
63
5 CONSIDERAES FINAIS
REFERNCIAS
ALCARDE, R. Modelos lineares mistos em dados longitudinais com o uso do pacote ASReml-
R. 2012. 156 p. Tese (Tese de doutorado) Escola Superior de Agricultura Luiz de Queiroz -
Universidade de So Paulo, Piracicaba, 2012.
BATES, D.; MAECHLER, M.; BOLKER, B.; WALKER, S. Fitting Linear Mixed-Effects
Models Using lme4. Vienna, 2015. Disponvel em: <https://cran.r-project.org/web/packages/
lme4/lme4.pdf>. Acesso em: 28 abr. 2016.
BOSE, R.C.; NAIR, K.R. Partially balanced incomplete block designs. Sankhya: The Indian
Journal of Statistics, Kolkata, v. 4, n. 3, p. 337372, 1939.
BURDICK, R.K.; GRAYBILL, F.A. Confidence intervals on variance components. New York:
Marcel Dekker, 1992. v. 127. 211 p.
COCHRAN, W.G.; COX, G.M. Experimental designs. New York: Wiley, 1957. 611 p.
COMSTOCK, R.E. Quantitative genetics and maize breeding. Maize Breeding and Genetics,
New York, v. 13, p. 191206, 1978.
DEMPSTER, A.P.; N.M., Laird.; D.B., Rubin. Maximum likelihood from incomplete data via
the em algorithm. Journal of the Royal Statistic Society, London, v. 39, p. 138, 1977.
66
DESSOTTI, C.; PIEDADE, S.M.S.; BARBIN, D.; SANCHES, P.F.; BAUTISTA, E.A.L. Compa-
rao de mdias de tratamentos em grupos de experimentos. Revista Brasileira de Biometria,
Jaboticabal, v. 31, p. 327336, 2013.
DUARTE, J.; VENCOVSKY, R. Estimao e predio por modelo linear misto com nfase na
ordenao de mdias de tratamentos genticos. Scientia Agricola, Piracicaba, v. 58, n. 1, p.
109117, 2001.
DUDLEY, J.W.; MOLL, R.H. Interpretation and use of estimation of heritability and genetic
variances in plant breeding. Crop Science, Madison, v. 2, n. 3, p. 257262, 1969.
GILMOUR, A.R.; THOMPSON, R.; CULLIS, B.R. Average information REML: an eficient
algorithm for variance parameter estimation in linear mixed models. Biometrics, Hoboken, v. 51,
n. 4, p. 14401450, 1995.
GOGEL, B.J.; CULLIS, B.R.; VERBYLA, A.P. REML estimation of multiplcative effects in
multi-environment variety trials. Biometrics, Hoboken, v. 51, n. 4, p. 744749, 1995.
HENDERSON, C.R. Aplications of linear model in animal breeding. Ontrio, 1984. Disponvel
em: <ftp://tech.obihiro.ac.jp/suzuki/Henderson.pdf>. Acesso em: 24 out. 2015.
HENDERSON, C.R.; KEMPTHORNE, O.; SEARLE, S.R.; Von Krosigk, C.M. The estimation
of environmental and genetic trends from records subject to culling. Biometrics, Hoboken, v. 15,
n. 2, p. 192218, 1959.
JUGENHEIMER, R.W. Corn inprovement, seed production and uses. Hoboken: John Wiley,
1976. 670 p.
KEMPTON, R.A.; FOX, P.N.; CEREZO, M. Statistical methods for plant variety evaluation.
London: Chapman & Hall, 1997. 191 p.
LEITE, M.S.O. Anlise multiambientes visando a recomendao regionalizada de clones
de cana-de-acar. 2011. 72 p. Tese (Tese de doutorado) Universidade Federal de Viosa,
Viosa, MG, 2011.
MAURO, A.O. Adaptabilidade, estabilidade e ganho gentico com o processo seletivo em
soja (Glycine max L.) em Ponta Por, Mato Grosso do Sul. 1991. 192 p. Tese (Tese de
doutorado) Universidade Federal de Viosa, Viosa, MG, 1991.
MENDIBURU, F. agricolae: Statistical Procedures for Agricultural Research. 2015. R
package version 1.2-3. Disponvel em: <http://CRAN.R-project.org/package=agricolae>. Acesso
em: 24 out. 2015.
MOORE, K.J.; DIXON, P.M. Analysis of combined experiments revisited. Agronomy Journal,
Madison, v. 107, n. 2, p. 763771, 2015.
MORAL, R. A; HINDE, J.; DEMETRIO, C.G.B. hnp: Half-Normal Plots with Simulation
Envelopes. 2016. R package version 1.2. Disponvel em: <http://CRAN.R-project.org/package=
hnp>. Acesso em: 29 jan. 2016.
MORO, G.V.; SANTOS, M.F.; BENTO, D.A.V.; AGUIAR, A.M; SOUZA-JNIOR, C.L. Genetic
analysis of kernel oil content in tropical maize with design III and qtl mapping. Euphytica,
Wageningen, v. 185, p. 419428, 2012.
PATERNIANI, E. Avaliao do mtodo de seleo entre e dentro de famlias de meio-irmos
no melhoramento de milho Zea Mays L. 1968. Tese (Tese de doutorado) Escola Superior
de Agricultura Luiz de Queiroz - Universidade de So Paulo, Piracicaba, 1968.
PATERNIANI, E.; VIEGAS, G.P. Melhoramento e produo do milho. Campinas: Fundao
Cargill, 1987. 795 p.
PATTERSON, H.D.; THOMPSON, R. Recovery of interblock information when blocks sizes are
unequal. Biometrika, Oxford, UK, v. 58, p. 545554, 1971.
PEREIRA-NETO, R. Estudo comparativo de mtodos de estimao da varincia de coefici-
entes de herdabilidade. 1994. 80 p. Dissertao (Dissertao de Mestrado) Escola Superior
de Agricultura Luiz de Queiroz - Universidade de So Paulo, Piracicaba, 1994.
PETERSEN, R.G. Agricultural fiels experiments design and analysis. New York: New York
Marcel Dekker, 1994. 409 p.
PIEPHO, H.P.; MHRING, J. Computing heritability and selection response from unbalanced
plant breeding trials. Genetics, Bethesda, v. 177, n. 3, p. 18811888, 2007.
PIEPHO, H.P.; MHRING, J.; MELCHINGER, A.E.; BCHSE, A. BLUP for phenotypic
selection in plant breeding and variety testing. Euphytica, Wageningen, v. 161, n. 1-2, p. 209228,
2007.
PIMENTEL-GOMES, F. Curso de estatstica experimental. Piracicaba: FEALQ, 2009. 451 p.
68
R Core Team. R: A Language and Environment for Statistical Computing. Vienna: R Foundation
for Statistical Computing, 2015. 3501 p.
REGAZZI, A.J.; SILVA, H.D.; VIANA, J.M.S.; CRUZ, C.D. Anlise de experimentos em
ltice quadrado com nfase em componentes de varincia. Pesquisa Agropecuria Brasileira,
Braslia, v. 34, n. 11, p. 19871997, 1999.
SCAPIM, C.A. Cruzametos dialticos entre sete variedades de milho doce (Zea maysL.) e
correlaes entre caracteres agronmicos. 1994. 96 p. Dissertao (Dissertao de Mestrado)
Universidade Federal de Viosa, Viosa, MG, 1994.
SCAPIM, C.A.; CARVALHO, C.G.; CRUZ, C.D. Uma proposta de classificao dos coeficientes
de variao para a cultura do milho. Pesquisa Agropecuria Brasileira, Braslia, v. 30, n. 5, p.
683686, 1995.
SELF, S.G.; LIANG, K-Y. Asymptotic properties of maximum likelihood estimators and likelihood
ratio tests under nonstandard conditions. Journal of the American Statistical Association,
Hoboken, v. 82, n. 398, p. 605610, 1987.
SILVA, H.D. Anlise de experimentos em ltice quadrado ("Square lattice) com nfase em
componentes de varincia e aplicaes no melhoramento gentico vegetal. 1997. 139 p. Tese
(Tese de doutorado) Universidade Federal de Viosa, Viosa, MG, 1997.
SILVA, H.D.; FERREIRA, D.F.; PACHECO, C.A.P. Avaliao de quatro alternativas de anlise de
experimentos em ltice quadrado, quanto estimao de componentes de varincia. Bragantia,
Campinas, v. 59, n. 1, p. 117123, 2000.
69
SMITH, A.B.; CULLIS, B.R.; THOMPSON, R. The analysis of crop cultivar breeding and
evaluation trials: an overview of current mixed model approaches. Journal of Agricultural
Science, Cambridge, v. 143, p. 449462, 2005.
SOLFERINI, O.B. Milho alto leo - parmetros genticos, correlaes entre modelos fixo
e misto e seleo. 2010. 145 p. Tese (Tese de doutorado) Universidade Estadual Paulista,
Jaboticabal, 2010.
SOLOGUREN, L. Demanda mundial cresce e Brasil tem espao para expandir produo. Viso
Agrcola, Piracicaba, v. 13, p. 811, 2015.
TOM, M.A.; BUENO-FILHO, J.S.S.; FERREIRA, D.F. Blocos fixos ou aleatrios? O caso dos
ensaios em ltice no melhoramento vegetal. Cincia e Agrotecnologia, Lavras, v. 26, n. 3, p.
576584, 2002.
WARDYN, B.M.; EDWARDS, J.W.; LAMKEY, K.R. The genetic structure of a maize population:
the role of dominance. Crop Science, Madison, v. 47, p. 467476, 2007.
YATES, F. A new method of arranging variety trials involvinga large number of varieties. Journal
of Agricultural Science, Cambridge, v. 26, n. 3, p. 424445, 1936.
ANEXOS
72
73
## 2) Descritiva
#avaliao por Ambiente
desv.padr = tapply(dados$PGCHA,dados$Local,sd)
var = tapply(dados$PGCHA,dados$Local,var)
media = tapply(dados$PGCHA,dados$Local,mean)
maximo = tapply(dados$PGCHA,dados$Local,max)
minimo = tapply(dados$PGCHA,dados$Local,min)
f1=function(x) max(x)-min(x)
amplitude = tapply(dados$PGCHA,dados$Local,f1)
LC_Progenie<- ambLC_Progenie[1:256,1]
names(LC_Progenie)<- c(1:256)
LC_Progenie[order(LC_Progenie, decreasing=T)][1:52] #ordenao
anova(mmodc2_PGCHA, mmodc2)
library(corrplot)
library(Hmisc)
#names(variaveis) = c(AN0203,AR0203,CA0203,ES0203,AN0304,
CA0304,ES0304,AN0506,ES0506,AN0607,ES0607) # use isso pra
aparecer o nome das variveis que voc quer no grfico
col2 = colorRampPalette(c(darkred,red,grey(0.9),blue,darkblue))
# no mexer
corrplot.mixed(correl,lower=ellipse,upper=number,col=col2(100))
round(rcorr(as.matrix(variaveis),type=spearman)$P,4) # testando a
significncia das correlaes