Академический Документы
Профессиональный Документы
Культура Документы
=
=
N
i
i N
X
1
1
donde X
i
es la medida en el i-simo animal. Cuando se determina la
media de una muestra se acostumbra a simbolizar como:
x
, mientras
que cuando se determina la media de una poblacin se simboliza
como: , siendo el primero un estadstico y el segundo un parmetro.
...Frmula (1)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
21
LA VARIANZA
El complemento de la media que sirva para caracterizar un
grupo (muestra o poblacin) resulta ser la varianza, la cual nos provee
informacin de cmo varan las mediciones, que conlleva a darnos
una idea del rango de las mediciones. La varianza de N observaciones
en la muestra de una poblacin es:
=
N
i
i N
X X s
1
2
1
1
2
) (
La varianza es la media de la sumatoria del cuadrado de la
cada una de las observaciones con respecto a la media. Si
eliminaramos el cuadrado, la sumatoria de cada una de las
observaciones con respecto a la media, sera igual a cero.
La varianza es una medida en unidades cuadradas, por
ejemplo: la tasa de crecimiento anteriormente tomada como ejemplo,
tendra sus unidades en (cm/mes)
2
, lo cual hace difcil su
interpretacin, por ello la desviacin estndar, que es la raz cuadrada
de la varianza, es bastante usada como expresin de variabilidad. Un
ejemplo de ellos sera las coeficientes estndar de dos lugares de
crianza donde la desviacin estndar de tasa de crecimiento de la fibra
son: 0.18 cm/mes y 0.26 cm/mes, nos indicaran que existe
relativamente un rango de variacin ms grande en el segundo grupo
de alpacas.
La frmula anterior de la varianza puede tomar una forma
diferente, mucho ms fcil de aplicar, cuando realizamos solo algunas
manipulaciones sencillas algebraicas:
...Frmula (2)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
22
+ =
+ =
+ = =
= = =
= = =
N
i
N
i
N
i
i i N
N
i
N
i
N
i
i i N
N
i
i i N
N
i
i N
X X X X
X X X X
X X X X X X s
1 1
2
1
2
1
1
1 1
2
1
2
1
1
1
2 2
1
1
1
2
1
1
2
2
* * 2
) * * 2 ( ) (
+ =
= =
=
N
i
N
i
i
N
i
i
i N
X N X
N
X
X
1
2
1
1
2
1
1
)
2
=
=
=
= =
=
= =
=
=
=
N
i
N
i
i
i N
N
i
N
i
i
N
i
i
i N
N
i
N
i
i
N
i
i
i N
N
i
N
i
i
N
i
i
i N
N
X
X
N
X
N
X
X
N
X
N
N
X
X
N
X
N
N
X
X
1
2
1 2
1
1
1
2
1
2
1 2
1
1
1
2
2
1
2
1 2
1
1
1
2
1
2
1 2
1
1
* 2
* 2
* 2
Cuando calculamos la media y la varianza para una muestra de
tamao N, el divisor de la media es N, mientras que el divisor de la
varianza es N-1. Esta diferencia se debe que para el clculo de la
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
23
varianza requiere de la media, esto conlleva a tener solamente N-1
observaciones independientes, una vez que la media es conocida. Por
ejemplo, si tenemos 4 alpacas con una media de tasas de crecimiento
de la fibra mensual de 1.1, conociendo solamente los datos de 3
animales, podremos conocer el valor de la cuarta alpaca, de modo que
X
4
=4(1.1)-( X
3
+ X
2
+ X
1
).
Obviamente estos indicadores (por ejemplo, media y varianza)
que caracterizan un grupo de animales, pueden ser referidos a una
muestra o a una poblacin, denominndose estadsticos o parmetros
respectivamente, y tambin la notacin es diferente.
Notacin de los estadsticos y parmetros
Poblacin Muestra
Media
_
x
Varianza
2
S
2
Desviacin estndar S
PROPIEDADES DE LA VARIANZA
A travs del presente documento utilizaremos algunas de las
propiedades que describimos a continuacin, para ello denominamos a
la observacin de las variables como x o y, mientras que para una
constante utilizaremos las primeras letras del alfabeto: a, b o c.
a) Var ax a Var x ( ) ( ) =
2
Esto nos lleva a indicar que si cada una de las observaciones es
multiplicada por una constante, la varianza se incrementa en la
constante al cuadrado. Esto indicado en una forma ms
especficamente sera:
=
= =
N
i
i N
N
i
i N
X X a X a aX aX Var
1
2 2
1
1
1
2
1
1
) ( ) ( ) (
) ( * ) (
2
X Var a aX Var =
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
24
b) Var x b Var x ( ) ( + = )
Si se aade una constante a cada observacin el valor de la
varianza no cambia, debido a que la variacin entre las
observaciones se mantiene, sin embargo la media cambio en una
cantidad igual a la constante. Si la varianza no cambia, tampoco lo
hace la desviacin estndar.
c) Var x y Var x Var y Cov x y ( ) ( ) ( ) ( , + = + ) + 2
d) Var x y Var x Var y Cov x y ( ) ( ) ( ) ( , = + ) 2
PARTICULARIDADES DE LA VARIANZA
Si dos o ms caracteres (o variables) son independientes o no
relacionadas, podramos tener las siguientes igualdades:
) ( ).... ( ) ( ) (
2 1 i
i
x Var x Var x Var x Var + + =
Considerando a todas las varianzas iguales y que cada observacin
sea independiente, tendramos:
) ( ) (
i
i
x nVar x Var =
Utilizando la propiedad anterior podemos encontrar tambin la
varianza de una media, que sera la siguiente:
n
x Var
x Var
n
x Var n
n
x
n
Var
i
i i
i
X
) (
) (
1
) ( * *
1
)
1
(
2
2
= = = =
La varianza de la media, mide la precisin de la misma, por otro
lado, ste parmetro nos hace visualizar que, la varianza de la
media es menor que la varianza de las observaciones, pues para
estimarla se divide entre la cantidad de las observaciones
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
25
2
2
2 2
: tambin o ), (
) (
: a debido ,
i
i
i
X
X
i
i
X X
n
x Var
n
x Var
= =
) (
Un ejemplo a ilustrarnos sera el siguiente:
Tamao (N) Desviacin estndar Comparaciones
Poblacin Grande =3.8 N
Muestra 1 200
269 . 0
200
=
1 1
Muestra 2 800
134 . 0
800
=
4 1/2
1.3 COVARIANZA
Si la varianza, nos permite observar cmo varan las
observaciones de un carcter, caracterstica o variable; la covarianza,
nos permite estimar como varan las observaciones de dos caracteres o
variables. La covarianza viene a ser el producto de las desviaciones
con respecto a la media, dividido entre el nmero de observaciones;
por tanto puede expresarse en trminos de esperanza de otra variable
z , siendo sta (x
i
-
x
)(y
i
-
y
):
[ ]
[ ] [ ] [ ]
[ ]
Cov x y E x y
E xy E x E y
E xy
x y
y x
x y
( , ) ( ) ( ) = =
= +
=
x y
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
26
Algunas propiedades son:
a) [ ] ) , ( ) , ( ) , ( ), ( y x aCov y b Cov y ax Cov y b ax Cov = + = +
b) [ ] ) , ( ) , ( ), ( z y Cov z x Cov z y x Cov + = +
Si dos variables son independientes, su covarianza es nula:
Cov x y E xy
x y x y x y
( , ) ( ) = = = 0
Que la covarianza sea nula, no significa que dos variables sean
independientes, sino slo que no estn linealmente relacionadas:
Veamos un ejemplo: Si: y=x
2
x N(0,1)
[ ] 0 ) , (
3
= =
x y
x E y x Cov
Otra forma de expresin es la siguiente:
) )( ( ) , ( y y x x y x Cov
ij ij
j i
=
Que puede ser derivada en la siguiente frmula de clculo:
=
N
y x
y x y x Cov
i i
i i
) , (
1.4 DISTRIBUCION NORMAL
Una variable aleatoria continua se distribuye siguiendo una
distribucin normal (distribucin univariante) con media y
desviacin estndar , siendo su funcin de densidad:
...Frmula (3)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
27
=
2
2
2
) (
2
1
) (
x
e x f
Esta expresin tambin puede escribirse como:
=
2
2
2
) (
exp
2
1
) (
x
x f
Si se estandariza x, vale decir si se resta la media y se le divide entre
la desviacin estndar, tendramos una distribucin de valores
aleatorios estandarizadas, que llamamos f(z), el cual tendr tambin
una distribucin normal con media igual a 0 y desviacin estndar
igual a 1, de modo que la funcin ser:
) 2 / exp(
2
1
) (
2
z x f =
De ste modo ahora se cumple que el valor de la funcin de
distribucin es 1 al considerar todos los valores posibles de z:
F z f z dz ( ) ( ) = =
1
00
00
Si se tienen varias variables aleatorias, la distribucin normal
(distribucin multivariante) puede ser explicada en trminos
matriciales con matriz vector medio igual a y matriz de varianzas-
covarianzas .
[ ] [ ]
x x X f * *
2
1
exp
2
) (
1 '
2 / 1
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
28
En notacin matricial la funcin de densidad del modelo mixto, se
expresa como:
[ ] [ ] ) ( ) ( exp
| | ) 2 (
1
) (
1
2
1
2
1
2
1
Xb y V Xb y
V
y f =
teniendo y una distribucin normal con media Xb, y con variancia V:
y N
n
(Xb, V), donde y= (y
1
, y
2
, ......... y
n
)
En mejoramiento como trabajamos con diferentes caracteres que son
cuantitativos, asumimos que stas tienen distribucin normal, esto es
una premisa importante, sin la cual no podramos derivar en modelos
especficos.
Como se puede ver en la figura anterior, la curva normal es
simtrica alrededor de la media, y por lo tanto proporciones
0.34
0.475
Tasa de crecimiento de fibra-
estandarizada (media = 0, desv.est.=1
F
r
e
c
u
e
n
c
i
a
r
e
l
a
t
i
v
a
d
e
l
a
s
m
e
d
i
c
i
o
n
e
s
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
29
especficas pueden ser encontradas tomando en consideracin la
media y un especfico nmero de desviaciones estndar. Por ejemplo,
dentro del rango de la media y media mas 1 encontramos el 34 % de
la poblacin, y dentro del rango de la media +/-1 encontramos el
68% de la poblacin. Similarmente dentro del rango de la media y
media mas 2 encontramos el 47.5 % de la poblacin, y dentro del
rango de la media +/-2 encontramos el 95% de la poblacin. De este
modo utilizando una tabla de valores Z, podemos encontrar las
proporciones que albergan dentro del rango. Consiguientemente dada
las propiedades de la distribucin normal y el conocimiento de la
media y la varianza de una poblacin, entonces las propiedades de la
distribucin de las observaciones para la poblacin pueden ser
predichas. Por ejemplo si la tasa de crecimiento de la fibra de las
alpacas, tiene una media de 1.1 cm/mes y una desviacin estndar de
0.18, entonces asumiendo que dicho carcter tiene distribucin
normal, se espera que el 95% de la poblacin de las alpacas tienen
tasas de crecimiento entre (1.1+1.96*0.18) y (1.1-1.96*0.18).
Si tomamos varias muestras de la poblacin, la variacin entre las
medias de las muestras puede ser estimada, a partir de variacin entre
las observacin en una sola muestra. Si las observaciones de una
poblacin tienen una distribucin normal con media y con varianza
2
, entonces los valores de las medias, estimadas de muestras de
tamao N, tendrn tambin una distribucin normal con media y
con varianza
2
/N.
Como las observaciones estn normalmente distribuidas, entonces las
medias muestrales tambin tendrn una distribucin normal, y como el
95% de las observaciones se encuentran dentro del rango de la media
+/- 2
2
, consecuentemente esto tambin sucede respecto a las medias
de las todas las muestras tomadas de la poblacin. De este modo, si
seguimos con el ejemplo anterior, y consideramos una muestra de
tamao 525 alpacas, entonces se espera que el 95 de todas las medias
de las muestras se encuentran dentro del rango de la media +/-
1.96*(1.1
2
/525), vale decir entre 1.006 y 1.194
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
30
1.5 ANALISIS DE VARIANZA
En la crianza animal, la prediccin de la tasa de mejora gentica
requiere informacin acerca de cunto de la variacin observada entre
los animales, es debida a la contribucin de la variacin gentica y
ambiental; y para ello la metodologa del Anlisis de Varianza
(ANAVA), es utilizada a fin de determinar las fuentes de variacin de
la varianza total.
A continuacin tenemos un cuadro en donde en la parte superior
se encuentran los grupos (en diseo de experimentos se conocen
como tratamientos o niveles del factor en estudio), en la parte media
los observaciones dentro de cada grupo o nivel, y en la parte inferior
las medias de cada grupo y la media general del grupo.
X
1
X
2
... X
i
X
11
X
21
X
31
x
i1
X
12
X
22
X
32
x
i2
X
13
x
23
x
33
x
i3
.
.
.
.
.
.
.
.
.
.
.
x
ij
.
1
__
. 1
X X 2
__
. 2
X X 3
__
. 3
X X i
i
X X
__
..
__
.
__
X X
Con estas designaciones nosotros podemos establecer que la
desviacin de una observacin con la media general : , tiene
dos componentes: la primera, la desviacin entre la media grupal con
la media global ( X = Efecto del grupo o tratamiento), y la
__
X X
ij
__
.
__
X i
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
31
segunda la desviacin entre la observacin y la media grupal
( =Efecto del error):
__
. i ij
X X
( )=( )+( ).
__
X X
ij
__
.
__
X X i
__
. i ij
X X
Si a la igualdad anterior, elevamos al cuadrados y luego sumamos,
podemos encontrar la varianza total, conformado por: a) la variacin
dentro del grupo, que viene a ser el promedio de la variacin entre las
observaciones dentro de un grupo, y b) la variacin entre grupos, que
es la variacin entre las medias de cada grupo.
As, dado un s grupos con n observaciones por grupos, el mtodo
del ANAVA, separa el total de la variacin entre las sn
observaciones en las variaciones entre grupos y dentro de los grupos.
La magnitud de la variacin entre grupos es una medida del tamao de
la diferencia entre grupos; de este manera, si las medias de los grupos
son similares, entonces la variacin entre los grupos ser pequea.
Cuadro N 1: Anlisis de varianza entre y dentro de grupos.
Fuente de
variacin
GL Suma de cuadrados Cuadrado
Medio
Cuadrados
medios esperados
Entre grupos s-1
S-TC=
2
) ( x x
i
SC
E
/gl =CM
E
2 2
E D
n +
Dentro de
grupos
s(n-I)
SN-S=
2
) (
i ij
x x
SC
D
/gl =CM
D
2
D
Total sn-I
SN-TC
2
) ( x x
ij
Donde:
) ... (
1 1
2
.
2
. 2
2
. 1
2
. i i
X X X
n
X
n
S + + = =
.. SC entre grupos sin corregir
) ... (
2 2
. 12
2
11
2
ij ij
X X X X SN + + = =
SC dentro de grupos sin
corregir
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
32
( )
sn
X
TC
ij
2
= .. Trmino de correccin
Cuando el diseo no es balanceado, vale decir cuando los grupos
tienen diferente nmero de observaciones, entonces la suma de
cuadrados entre grupos sin corregir se puede resolver as:
i
i
i
i
n
X
n
X
n
X
X
n
S
2
2
2
2
1
2
1 2
.
...
1
+ + + = =
2
E
2
0
2
E D
n +
donde:
=
=
s
i
i
n
N
N
s
n
1
2
0
1
1
1
Del cuadrado medio esperado, nosotros entonces podemos encontrar
las varianzas, que sera:
...Frmula (5)
...Frmula (4)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
33
= =
n
CM CM
CM
D E
E D D
2 2
que mientras
La varianza de la media estimada, para n observaciones por grupo,
nos brinda una medida de precisin con que la media de cada grupo es
estimada, siendo esta:
n
D
E
2
2
+
Si la media del grupo no tendra error, entonces la varianza sera igual
a la varianza entre grupos . Debido a que la media de grupo es
estimada de una muestra de n observaciones, entonces la varianza
del error de muestreo es
2
E
n
D
2
n
D
2
m
e
t
r
o
d
e
l
a
f
i
b
r
a
(
m
i
c
r
a
s
)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
35
puntos se encuentran en el cuadrante superior izquierdo y en el
cuadrante inferior derecho, entonces nos indica que las variables
tienen relacin negativa, lo cual mientras una variable se incrementa,
la otra disminuye.
Asumiendo una regresin lineal entre los caracteres X e Y, de
modo que por cada unidad de incremento en X, hay un
correspondiente cambio en Y de bYX unidades, entonces la ecuacin
de la regresin puede tomar la siguiente forma:
X b a Y
yx
* + =
Para estimar el coeficiente de regresin del carcter Y sobre X, se
divide la covarianza entre los dos caracteres sobre la varianza de la
covariable (en este caso X).
) var(
) , cov(
2
X
Y X
b
X
XY
YX
= =
...Frmula (7)
...Frmula (8)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
36
En el grfico anterior podemos ver que la lnea de regresin pasa justo
por la media de ambos caracteres, de modo que para estimar el
intercepto, podemos tener de referencia la media de la medida del
carcter a predecir, y restarle la distancia entre dicha media y el
producto de la media del carcter predictor y el coeficiente de
regresin.
) (
_ _
*
XY
b X Y a =
Tomando el cuenta que la ecuacin de la regresin es: Y= a + b
YX
*X
y reemplazando el valor encontrado del intercepto, la ecuacin de
regresin puede ser tambin escrito como:
X b b X Y Y
XY XY ) ( ) (
_ _
) * ( + =
...Frmula (9)
) , ( Y
a
Y
) (
*
XY
b X
) ( XY
b
) ( XY
b
) ( XY
b
Carcter Y
Carcter X
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
37
si realizamos una pequea manipulacin algebraica, obtenemos la
siguiente expresin:
) ( ) (
) (
X X b Y Y
XY
=
Esta expresin utilizaremos a lo largo del presente documento con la
finalidad de realizar predicciones del valor gentico del animal,
teniendo como variable predictora el fenotipo del propio animal o hijo
o de los hermanos o de los familiares o en general de todos los
parientes y del propio animal inclusive.
CORRELACION.
El coeficiente de regresin describe la relacin lineal entre dos
caracteres, mientras que la correlacin es una medida de la variacin
en un carcter (Y) atribuida a la relacin lineal con el otro carcter
(X). Algunas veces el objetivo del anlisis de correlacin es medir el
grado de la asociacin observada entre cualquier par de variables.
Luego, mediante una prueba de hiptesis, comprobar si es mayor de lo
que podra esperarse solamente por casualidad. Frecuentemente los
investigadores de las diversas reas del conocimiento se interesan
por saber cmo se relacionan entre s dos variables en un determinado
grupo de personas
Existe alguna relacin entre la finura de la fibra y el peso de las
alpacas?
Existe alguna relacin entre la finura de la fibra y el peso de velln de
las alpacas?
Dentro de las interpretaciones, que se le puede dar a la correlacin, se
tiene:
Mide la intensidad de la asociacin entre un par de variables
Representa la magnitud de la relacin lineal entre dos variables
...Frmula (10)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
38
Promedio de los valores estandarizados
El que exista correlacin, no necesariamente implica una relacin
causal entre ellas. Es posible, sin embargo, que la correlacin entre
variables puede resultar de mucha utilidad para identificar relaciones
causales cuando se adopta a otros enfoques metodolgicos, pero es
una prueba peligrosa y errnea si se emplea como nica prueba de la
existencia de causalidad.
El valor de la correlacin vara entre -1 a 1, indicando que valores
extremos a este rango una alta correlacin, y valores alrededor de cero
valores bajos o nula correlacin.
Las fuentes de variacin entre las variables pueden tomar las
siguientes formas:
Y2 Y1 Y2 es la nica fuente de variacin de Y1,
1 r 1
r =1
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
39
La variable comn Y3 determina completamente Y1 e Y2.
Y2
Y3 Nuevamente r
12
=1.
Y1
Y
2
es una de las diversas fuentes de variacin de Y
1
.
Y2
Y3 Y1 Ahora: r
12
< 1
Y4
Y3 Y1 r
12
se debe a un antecedente comn Y
4
.
Como Y
3
e Y
5
tambin tienen presencia,
la correlacin entre Y
1
e Y
2:
no ser
Y4 perfecta.
Y5 Y2
Y3 Y1 r
12
se debe al efecto directo de Y
2
en
Y
1
, asi como a la variable comn Y
4
que afecta a ambas variables
Y4
Y5 Y2
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
40
En el siguiente grfico observamos dos distribuciones que tienen el
mismo coeficiente de regresin e intercepto, sin embargo tienen
diferentes correlaciones.
En el grfico de la izquierda hay menor variacin y
consecuentemente mayor correlacin - que en el grfico de la derecha.
El coeficiente de correlacin se puede estimar mediante la siguiente
ecuacin:
( )( )
( )
( )
1
*
1
1
) ( * ) (
) , (
2
2
= =
n
Y
n
X
n
Y X
Y Var X Var
Y X Cov
y
x
y
x
r
i i
i
i
yx
y x
xy
yx r
*
=
...Frmula (11)
Alzada de alpaca
Peso vivo
Peso vivo
b
b
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
41
El coeficiente de correlacin puede ser puede ser explicado en base al
coeficiente de regresin, y viceversa:
Ahora expresando la regresin en funcin a la correlacin:
Para examinar la relacin lineal entre dos caracteres X e Y, se utiliza
el anlisis de varianza, siendo el procedimiento el siguiente:
Caracteres
X
Y
X
11
Y
11
X
12
Y
12
X
13
Y
13
X
14
Y
14
Pares de
observaciones
Hermanos enteros
X
Y
y
x
yx
y x x
x xy
y x
xy
yx
b
r
= = =
* *
*
*
*
x
y
yx
yx
r
b
=
...Frmula (12)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
42
1.8 FUENTES DE VARIACIN DE LA REGRESIN
Del anlisis detallado del grfico anterior, se puede que la variacin de
Y
i
, con respecto a la media de Y, tiene solamente dos componentes,
una referida al explicada por la regresin y la otra no explicada por la
regresin:
)
( )
( ) ( Y Y Y Y Y Y
i i
+ =
Por tanto el anlisis de varianza toma, la siguiente forma:
Fuente de
variacin
GL Suma de
cuadrados
Suma de cuadrados
(en trminos de b)
Suma de cuadrados
(en trminos de r)
Regresin
1
2
)
( Y Y
) 1 ( * *
) ( *
2 2
=
=
N b
X X b
yx
i
) 1 ( * *
2 2
= N r
y
Error o
residual
N-2
2
)
( Y Y
i
Puede ser hallado por
diferencia
) 1 ( * * ) 1 (
2 2
= N r
y
Total
N-1
2
) ( Y Y
i
) 1 ( *
2
= N
y
) 1 ( *
2
= N
y
Eje de las X
) (
X X b Y Y =
Y
Y Y e
=
Y X ,
Y X ,
Y X ,
Y X
,
Y
) (
X X b Y Y + =
Eje de las Y
Eje de las X
) (
X X b Y Y =
Y
Y Y e
=
Y X ,
Y X ,
Y X ,
Y X
,
Y
) (
X X b Y Y + =
Eje de las Y
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
43
La proporcin de la varianza en el carcter Y, no explicada por la
regresin, es fcilmente obtenible mediante el cociente entre la suma
de cuadrados del error entre los grados libertad del error, siendo esto
lo siguiente:
2
) 1 ( * * ) 1 (
2
) (
2 2
2
N
N r
N
Y Y
y
El error estndar del coeficiente de regresin explica la variacin en la
variable dependiente Y, que es tomada en cuenta por la regresin
sobre la variable independiente (X). La varianza del coeficiente de
regresin estimado es el cuadrado medio residual dividido por la suma
de cuadrados de la variable independiente:
( )
) 1 ( *
2
) 1 ( * * ) 1 (
2
) 1 ( * * ) 1 (
2
2 2
2
2 2
2
N
N
N r
X X
N
N r
S
x
y y
b
2
2 2
2
* ) 2 (
* ) 1 (
x
y
b
N
r
S
=
...Frmula (14)
...Frmula (13)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
44
2. ANAVA Y GENETICA CUANTITATIVA
2.1 CME Y REPETIBILIDAD
Cul es la finalidad de estimar la varianza entre grupos y dentro de
grupos?. La respuesta es que mediante ello podemos estimar algunos
parmetros genticos de inters como por ejemplo: la repetibilidad.
Si se tienen medidas repetidas de un determinado carcter para un
individuo, se puede estimar la repetibilidad a travs de un Anlisis de
Varianza para un modelo con un factor de clasificacin:
y w
ij i ij
e = + +
efecto del individuo i-simo
observacin j-sima del individuo i-simo
que nos permitir extraer informacin de:
2
E
que representa la diferencia existente entre individuos,
es decir la varianza debido a los efectos genotpicos
del individuo mas los efectos medioambientales
permanentes.
2
D
que es la diferencia existente dentro de individuos, es
decir la varianza debido a los efectos ambientales
temporales.
de forma que podremos estimar la repetibilidad segn:
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
45
2 2
2
D E
E
+
= r
En forma general la relacin que existe entre la varianza entre los
grupos y la variacin total se denomina correlacin (t). Si la varianza
dentro de grupos es pequea, entonces las observaciones dentro de un
grupo son similares y por lo tanto altamente correlacionadas o
repetibles. Contrariamente a ello, si la varianza dentro de grupos es
grande, entonces existe una fuerte variacin entre las observaciones
dentro del grupo, y por lo tanto la correlacin (repetibilidad) ser baja.
Ahora recordemos que la varianza de la media de grupo estimada es
n
D
E
2
2
+ , entonces poniendo en funcin de trminos de repetibilidad
(r), tendramos:
Si:
2 2
2
D E
E
r
+
= ) (
2 2 2
D E E
r + =
Si:
2 2
2
D E
E
r
+
=
) (
2 2 2
D E E
r + =
sumando a cada
trmino
) (
2 2 2 2 2
D D E D E
r + + = +
2
D
agrupando y
transponiendo trminos
2 2 2 2 2
) ( ) (
D D E D E
r = + +
factorizando ) )( 1 (
2 2 2
D D E
r = + ) (
2 2
D E
+
Por tanto resulta que:
) )( 1 (
2 2 2
D E D
r + =
...Frmula (15)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
46
Considerando que la varianza de una media de grupo estimada es
n
D
E
2
2
+ , entonces dicha varianza en trminos de repetibilidad (r) y
nmero de repeticiones por animal (n), reemplazando con los trminos
encontrados, resulta ser:
+
+
+
+ =
+ +
+
+ +
n
r n
n
r rn
n
r
r
n
r
r
D E
D E D E
D E
D E
) 1 ( 1
) (
1
) (
1
) (
) )( 1 (
) (
2 2
2 2 2 2
2 2
2 2
+
+
n
r n
D E
) 1 ( 1
) (
2 2
Finalmente, sabiendo que: encontramos:
2 2 2
) (
P D E
= +
+
n
r n
P
) 1 ( 1
2
2.2 REPETIBILIDAD Y VARIACION
Cul es la importancia de las medidas repetidas? Para responder a
ello, supongamos que tenemos una Var(P) = 10, y consideremos
distintas repetibilidades (r) de 0.15, 0.25 y 0.6, con diferentes medidas
repetidas (1,2,3,4,5). Ploteando la salidas obtenemos el siguiente
grfico.
...Frmula (16)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
47
2.00
3.00
4.00
5.00
6.00
7.00
8.00
9.00
10.00
0 1 2 3 4 5 6
Nmero de mediciones
V
a
r
i
a
n
z
a
F
e
n
o
t
p
i
c
a
r=0.15
r=0.25
r=0.6
En el grfico anterior podemos observar que a mayor cantidad de
repeticiones la varianza se reduce, sin embargo las mayores
disminuciones se obtienen con repetibilidades bajas, es as que con
una r=0.15, y considerando 2 mediciones, la varianza disminuye casi
en un 50% (desde 10 a 5.75), mientras que con una r=0.55, tambin se
obtiene disminucin, pero no tan grande (desde 10 a 7.75). A mayor
nmero de mediciones resulta menor la disminucin de la varianza,
obtenindose cada vez menores decrementos, de modo que con
mediciones mayores a 4, ya la disminucin no resulta tan significativa.
Si muchas mediciones son realizadas sobre cada animal, las
mediciones no sern las mismas, debido a las situaciones marginales
siguientes:
Si las mediciones fueran hechas en un periodo corto de tiempo,
entonces la diferencia entre las mediciones sern debidas al error de
medicin, consecuentemente debida a la variacin medioambiental
especfica del animal, tal como las diferencias entre el lado
izquierdo y derecho de una carcasa.
Si las mediciones fueran hechos en un periodo largo, entonces la
diferencia entre las mediciones sern debidos a la variacin
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
48
medioambiental en comn, un ejemplo de ello representa las
diferencias debido a un consumo de alimento bajo, comparado con
otro periodo de tiempo donde el consumo de alimento fue normal.
En funcin a lo anterior el efecto medioambiental puede ser dividido
en efecto medioambiental comn E
c
, el cual afecta a todos los
animales, y el efecto medioambiental especfico E
s
, que afecta
especficamente a cada animal. Por lo tanto los componentes del
fenotipo sern:
P = G + E
s
+ E
c
Entonces la repetibilidad de las mediciones ser:
2
2 2
P
E G
e
C
r
+
= mientras que la heredabilidad es:
2
2
2
P
G
h
=
En funcin a lo anterior, podemos indicar que la repetibilidad ser
mayor que la heredabilidad, o en el mejor de los casos, si la variacin
debido a efectos medioambientales especficos fuese nulo, la
repetibilidad sera igual a la heredabilidad; consecuentemente en base
a ello podemos concluir que la repetibilidad marca el valor lmite de la
heredabilidad; siendo la ventaja que es mucho ms fcil determinar la
repetibilidad que la heredabilidad.
EJEMPLO SOBRE REPETIBILIDAD
En el rebao de la Universidad Nacional de Huancavelica se tomaron
5 alpacas macho al azar contemporneas y se registraron los pesos de
velln (expresados en gramos) durante cinco esquilas consecutivas. A
partir de estos datos estimar la repetibilidad para la caracterstica peso
de velln.
...Frmula (17)
...Frmula (18)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
49
Esquilas
Individuos
1 2 3 4
00.69 2274* 2250 2070 2515
00.64 1944 1352 1582 1818
00.60 2036 2300 2078 2268
00.24 1106 1300 1336 1646
* Peso de velln en gramos
ANALISIS DE VARIANZA PARA LOS DATOS ANTERIORES
Caracterstica de inters: Peso de velln
Suma de
cuadrados gl
Media
cuadrtica CME
Entre alpacas
2272264.688 3 757421.563 42395.81+4(178756.4)
Dentro de alpacas
508749.750 12 42395.813 42395.81
Total
2781014.438 15
Los resultados de la presente tabla fueron obtenidos utilizando el
software estadstico SPSS Versin 12.
De la tabla podemos deducir que:
2
E
178 756.4 (Ver frmula 5 )
2
D
42 395.81 (Ver cuadro N 2)
Consecuentemente, la repetibilidad ser:
23 . 0
81 . 42395 4 . 178756
4 . 178756
2 2
2
=
+
=
+
=
D E
E
r
(Ver frmula 11)
La varianza total resulta ser:
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
50
25 . 221152 81 . 42395 4 . 178765 ) (
2 2 2
= + = + =
D E P
Mientras que la varianza de las medias de los grupos es:
2994 . 17139
4
23 . 0 * ) 1 4 ( 1
25 . 221152
) 1 ( 1
2
=
+
=
+
n
r n
P
2.3 CME Y COMPONENTES GENTICOS
Dentro del marco de gentica cuantitativa, el mtodo del Anlisis de
Varianza es usado para separar la variacin total en sus componentes,
tales como la variacin gentica y la variacin ambiental. La
heredabilidad que es otro parmetro importante de la gentica
cuantitativa, es una funcin de la varianza gentica y ambiental. La
respuesta a la mejora gentica, as como la prediccin de mrito
gentico de un animal dependen de la heredabilidad.
Por ejemplo, las alpacas pueden ser agrupados de acuerdo a los
machos, de modo que la variacin total entre animales puede ser
separado en sus componentes: 1) Variacin entre animales de
diferentes alpacas machos, y; 2) Variacin entre animales que
provienen de un solo macho. Este tipo de agrupacin nos permite
estructurar muchas familias de medios hermanos, y de este modo
podemos encontrar la variabilidad con solo encontrar la variacin
entre familias de los machos y dentro de las familias de los machos.
Por otro lado, si las observaciones son agrupadas de acuerdo a las
alpacas madres, la variacin entre familias de alpacas madres y dentro
de la familia de alpacas madres nos proveen informacin de los
efectos maternales y de los efectos medioambientales comunes.
Esta forma de agrupacin tambin se puede realizar en vacunos de
leche, vacunos de carne, cerdos, entro otros; de modo que se pueden
agrupar grupos de medios hermanos (cuando se refiere a las
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
51
observaciones dentro de los padres) y hermanos enteros (cuando se
refiere a las observaciones dentro de las madres)
Reproduc.
macho
1
2
3
Alpacas
madres
1
2
3
4
5
6
7
8
9
X
111
X
121
X
131
X
241
X
251
X
261
X
371
X
381
X
391
X
112
X
122
X
132
X
242
X
252
X
262
X
372
X
382
X
392
X
113
X
123
X
133
X
243
X
253
X
263
X
373
X
383
X
393
Hijos
X
114
X
124
X
134
X
244
X
254
X
264
X
374
X
384
X
394
Hermanos
enteros
X
11.
X
12.
X
13.
X
24.
X
25.
X
26.
X
37.
X
38.
X
39.
medios
Hermanos
X
1..
X
1..
X
1..
total
X
...
N
4 4 4 4 4 4 4 4 4
Cuadro N 4: Anlisis de varianza de un diseo jerrquico.
Fuente de
variacin
GL Suma de
cuadrados
Cuadrado Medio Cuadrados medios
esperados
Entre padres s-1 S-TC SC
S
/gl =CM
S
2
3
2
2
2
S D W
k k + + =
CM
E
Entre
madre(padres)
s(d-I) SD-S SC
D(S)
/gl =CM
D
2
1
2
D W
k + =CM
D
Entre hijos
(madre/padres)
sd(n-1) SDN-SD SC
H(D/S)
/gl =CM
W
2
W
=CM
W
Total sdn-sd SDN-TC
k1 = k2 Nmero de hijos por madre (n).
k3 Nmero de hijos por padre (nd).
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
52
2 2 2
, ,
S D W
Representan la varianza del error, de las madre y de
los machos respectivamente .
En realidad, desde el punto de vista estadstico el modelo corresponde
a un diseo jerrquico con factores aleatorios, y consiguientemente
para los clculos se operan siguiendo los siguientes tems:
S
= + + + = =
2 2
. 4
2
. 3
2
. 2
2
. 1
2
.
3
1
) (
1 1
i i
X
sd
X X X X
n
X
k
S
SD
SDN
= + + + + = =
2 2
394
2
113
2
112
2
111
2
) ... (
ij ijk
X X X X X X SDN
TC ( )
2 1
=
ijk
X
sdn
TC
El desarrollo indicado ser eficiente cuando existe un nmero igual de
hijos dentro de cada madre, sin embargo en la realidad esto no es as,
pero por ahora no nos complicaremos y seguiremos adelante a fin de
no hacer tan difcil esta cuestin.
Desde el punto de vista de mejoramiento gentico, cada uno de los
componentes de varianza tiene un significado, siendo esta la siguiente:
La varianza entre padres es:
nd
CM CM
D S
E
=
2
La varianza entre madres es:
n
CM CM
W D
D
=
2
La varianza residual es:
W
CM =
W
= + + + + = =
2 2
. 39
2
. 13
2
. 12
2
. 11
2
.
2
1
) ... (
1
ij ij
X
d
X X X X X
k
SD
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
53
Los cuales pueden ser utilizados para calcular funciones de los
componentes de varianza genticos:
La varianza fenotpica es:
2 2
2 2
S D W P
+ + =
La correlacin entre medios hermanos es:
2
2
P
S
HS
t
=
La correlacin entre hermanos enteros es:
2
2
P
D
FS
t
=
A continuacin mostramos las mediciones en dos caractersticas (Peso
al nacimiento expresado en kilogramos y alzada al nacimiento
expresado en centmetros), de un grupo de alpacas cuyos padres han
sido identificados. En funcin a ello, resolveremos un ejercicio con la
finalidad de determinar los componentes de varianza, utilizando la
metodologa del anlisis de varianza.
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
54
La disposicin de dichos datos, para la variable peso al nacimiento,
tomara la siguiente forma.
Padre -> 0,209 883 480
Madre -> 2,103 9,66 9,131 2,121 9,667 0,153 9,069 9,063 513
8,5 9,5 9,8 7,0 9,0 9,8 8,8 7,8 9,0
Hijos (kg)
9,5 11,0 9,2 8,0 8,5 7,2 11,5 7,0 8,3
Suma(M) 18,0 20,5 19,0 15,0 17,5 17,0 20,3 14,8 17,3
Suma(P) 57,5 49,5 52,4
Las sumas de cuadrados de los componentes sin corregir, se
determinan de la siguiente manera:
S 043 . 1417 ) 4 . 52 5 . 49 5 . 57 (
6
1
3 * 2
1
2 2 2 2
.
= + + = =
i
X S
Peso Nac Alzada Nac
Madre
(N arete) Raza Color
Padre
(N arete)
8,5 54 2,103 Huacaya Blanco 0,209
9,5 62 2,103 Huacaya Blanco 0,209
9,5 63 9,66 Huacaya Blanco 0,209
11.0 60 9,66 Huacaya Blanco 0,209
9,8 62 9,131 Huacaya Blanco 0,209
9,2 62 9,131 Huacaya Blanco 0,209
7.0 57 2,121 Huacaya Blanco 883
8.0 64 2,121 Huacaya Blanco 883
9.0 60 9,667 Huacaya Blanco 883
8,5 60 9,667 Huacaya Blanco 883
9,8 62 0,153 Huacaya Blanco 883
7,2 59 0,153 Huacaya Blanco 883
8,8 58 9,069 Huacaya Blanco 480
11,5 57 9,069 Huacaya Blanco 480
7,8 56 9,063 Huacaya Blanco 480
7.0 55 9,063 Huacaya Blanco 480
9.0 59 513 Huacaya Blanco 480
8,3 59 513 Huacaya Blanco 480
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
55
SD 960 . 1427 ) 3 . 17 ... 5 . 20 18 (
2
1
2 2 2 2
.
= + + + = =
ij
X SD
SDN 980 . 1437 ) 3 . 8 ... 5 . 9 5 . 8 (
2 2 2 2
= + + + = =
ijk
X SDN
TC ( ) ( ) 576 . 1411 4 . 159
2 * 3 * 3
1 1
2
2
= = =
ijk
X
sdn
TC
FV GL SC CM CME
Padre s-1=3-1=2 S-TC 5,468 2,734 Var(e)+2Var(M)+6Var(P)
Madre/Padre (d-1)*s=(3-1)*3=6 SD-S 10,917 1,819 Var(e)+2Var(M)
Hijo/Madre/
Padre (n-1)*d*s=(2-1)*3*3=9 SDN-SD 10,020 1,113 Var(e)
TOTAL sdn-1=2*3*3-1=17 SDN-TC 26.404
La varianza entre padres es:
152 . 0
6
819 . 1 734 . 2
2
=
=
nd
CM CM
D S
S
La varianza entre madres es: 353 . 0
2
113 . 1 819 . 1
2
=
=
D
La varianza residual es: 113 . 1
2
= =
W W
CM
La varianza fenotpica es:
61880 . 1 152 . 0 353 . 0 113 . 1
2 2 2 2
= + + = + + =
S D W P
La correlacin entre medios hermanos es:
09415 . 0
61880 . 1
152 . 0
2
2
= = =
P
S
HS
t
La correlacin entre hermanos enteros es:
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
56
21809 . 0
61880 . 1
353 . 0
2
2
= = =
P
D
FS
t
Veamos como cambian los cuadrados medios y los cuadrados medios
esperados cuando se consideran, a) solamente padres; b)solo madres;
y c)padres y madres a la vez.
EN LOS CUADRADOS MEDIOS
Modelo CM
W
CM
D
CM
S
Relaciones entre
progenies
Solo padres 1.39577 --- 2.73388 Medios hermanos
Solo madres 1.11333 2.048056 --- Enteros hermanos
Padres y
madres
1.11333 1.819444 2.73388 Enteros y medios
hermanos
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
57
EN LOS COMPONENTES DE VARIANZA
Modelo
2
w
2
d
2
s
2
p
Relaciones entre
progenies
Solo padres 1.39578 --- 0.22302 1.61880 Medios hermanos
Solo madres 1.11333 0.4673611 --- 1.58069 Enteros hermanos
Padres y
madres
1.11333 0.3530556 0.15240 1.61880 Enteros y medios
hermanos
*La solucin fue obtenida utilizando el software SPSS Versin 12
En los dos cuadros anteriores claramente puede observarse que el
cambio en el modelo tiene un efecto sobre las varianzas estimadas, y
por lo tanto es importante el modelo a escoger tomando en cuenta la
estructura de los datos, a fin de realizar estimaciones apropiadas de los
parmetros genticos. Si consideramos encontrar la heredabilidad
solo en funcin a padres, sta resulta ser sobreestimada, pues la
varianza fenotpica resulta ser similar a la que se obtiene cuando se
consideran padres y madres a la vez, aunque la varianza entre padres
resulta ser incrementada.
INTERPRETACION GENETICA DE LOS COMPONENTES DE
VARIANZA
Un modelo asume que las medidas del animal reflejan el fenotipo (P),
el cual tiene componentes gentico y medioambiental. El efecto o
componente gentico puede ser dividido en efecto aditivo (A), efecto
maternal (M) y efecto de interaccin(I). Por otro lado, el efecto
medioambiental puede ser separado en un componente comn y un
componente especfico (E
c
y E
e
), de modo que el modelo P = G + E,
puede ser extendido a la siguiente forma:
P=A + M + I + E
c
+ E
e
El efecto gentico aditivo es la suma de los efectos promedio de los
genes, que es similar a la suma de cada par de alelos en cada locus
para todos los locus. El efecto maternal es la influencia del fenotipo de
la madre sobre el fenotipo de su progenie, el cual incrementa la
semejanza entre la madre y sus hijos. El efecto de la interaccin es
ME pacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
58
TODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Al
debido a la interaccin entre alelos del mismo locus (dominancia) ms
la interaccin de genes de diferentes locus (epistasis).
El efecto del medioambiente comn incrementa la semejanza entre
hermanos enteros debido a que stos encuentran en un mismo
ambiente, sin embargo existe diferencia entre M y E
c
, debido a que el
efecto maternal aumenta directamente la semejanza la progenie y la
madre, aumentando indirectamente la semejanza entre la progenie,
mientras que el efecto ambiental comn aumenta la semejanza entre la
progenie en forma directamente.
Ofs Ofs
M
DIFERENCIA ENTRE EFECTO M y Ec
Ec
Los componentes de varianza estimados de padre, madre y residuo
son utilizados para cuantificar las contribuciones del medioambiente y
de la parte gentica al fenotipo.
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
59
Cuadro N 5: Interpretacin de componentes de varianza estadstico
en componentes de varianza genticos.
2
I
Compo-
nentes
Covarianza
2
A
2
D
2
AA
2
AD
2
DD
2
AAA
2
M
2
E
c
2
E
e
2
s
Cov
HS
*
0 1/16 0 0 1/64
0 0 0
2
d
Cov
FS
-Cov
HS
3/16 1/8 1/16 7/64 1 1 0
2
e
2
T
Cov
FS
7/8 15/16 7/8 0 0 1
2
T
1 1 1 1 1 1 1 1 1
2
s
+
2
d
Cov
FS
**
1/8 1/16 1/8 1 1 0
* Cov
HS
= covariancia de medios hermanos.
** Cov
FS
= covariancia de hermanos de padre y madre.
De la tabla anterior podemos sacar algunas conclusiones:
El componente
2
s
, se debe a las diferencias entre grupos de
padres, y estando estos grupos formados por medios hermanos,
entonces ste componente es la covarianza entre medios
hermanos.
El componente
2
d
proviene de las diferencias entre grupos de
madres, habiendo sido removido la
2
s
. Estando estos grupos
conformados por hermanos completos, entonces ste componente
es la covarianza entre hermanos enteros, menos la remosin de
2
s
.
Puesto que cualquier componente de varianza entre grupos es
igual a la covarianza de los miembros de los grupos, se deduce que
la componente dentro de los grupos es igual a la varianza total
menos la covarianza de los miembros de los grupos. Las progenies
de las hembras son familias de hermanos enteros, por lo tanto, el
componente
2
e
, estima
2
T
Cov
FS
El componente de varianza entre padres tiene de la varianza
aditiva, y tambin cierta proporcin de varianza de interaccin, sin
embargo sta ltima es pequea (1/16+1/64+), por lo que para
efectos de clculo no se tiene en cuenta.
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
60
El componente de varianza entre madres tiene de la varianza
aditiva, pero tambin en ella se incluye una parte de la varianza de
interaccin (1/4 + 3/16 + 1/8 .) y la totalidad varianza del efecto
maternal; asimismo tambin se incluye dentro de ella el total de
variacin debida E
c
. Por lo tanto para fines tiles de este
componente de varianza es necesario tener en cuenta algunas
premisas debido a que ste componente tiene muchos parmetros
que son estimados simultneamente. As, por ejemplo el efecto de
la interaccin puede ser ignorado.
Como para la estimacin del efecto maternal se requiere
informacin de la progenie de muchas camadas de cada madre,
entonces el efecto del medioambiente comn puede ser separado
del efecto gentico maternal, mediante una simple resta a la
variancia entre progenies dentro de madres/padres, del doble de la
varianza entre padres:
2
e
-2
2
s
Si en el cuadro anterior, el efecto maternal y el efecto medioambiental
comn son combinados y la varianza debido a la interaccin es
ignorando, entonces la varianza fenotpica es la suma de la varianza
gentica aditiva, la varianza del efecto maternal/medioambiente
comn y la varianza del medioambiente especial, siendo el modelo el
siguiente:
2
P
=
2
A
+
2
M
+
2
E
De este modo poniendo los componentes de varianza esperados en
trminos de varianzas del modelo gentico tendremos:
2
T
=
2
P
2
s
= (1/4)
2
A
2
A
=4
2
s
2
d
= (1/4)
2
A
+
2
M
=
2
s
+
2
M
2
M
=
2
d
-
2
s
2
e
=
2
T -
(1/2)
2
A
-
2
M =
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
61
(
2
T
-
2
M
)- (1/2)
2
A=
2
Ee
+ 2
2
s
2
Ee
=
2
e
-2
2
s
De modo que en trminos de componentes de varianza esperados, la
varianza fenotpica sera
2
P
=4
2
s
+ (
2
d
-
2
s
)+ (
2
e
-2
2
s
) =
2
s
+
2
d
+
2
e
Cuando solo consideramos medios hermanos (ya no incluimos en el
modelo a las madres, los componentes de varianza asumen las
siguientes igualdades:
2
s
=(1/4)
2
A
2
A
=4
2
s
2
e
=
2
P
-(1/4)*
2
A=
2
E
+(3/4)*
2
A
2
E
=
2
e
-3
2
s
*NOTA: Los subndices en minscula designan los componentes de
varianza estimados, mientras que los subndices en
mayscula designan los componentes del modelo gentico.
2.4 HEREDABILIDAD
Al cociente entre la varianza de los valores aditivos (la llamada
varianza aditiva) y los fenotpicos (varianza fenotpica) se llama
heredabilidad de un carcter.
2
2
2
) (
) (
P
A
P Var
A Var
h
= =
Interesa conocer la heredabilidad de un carcter por que nos da una
idea de nuestras posibilidades de seleccin. Si h es alta esto significa
que la variacin observada se debe a causas genticas aditivas
(heredables) principalmente, por lo que escogiendo a los mejores
individuos estaremos escogiendo tambin a los que tienen mejores
alelos y a los que mejor descendencia (por termino medio) dejarn.
...Frmula (19)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
62
No es suficiente que la heredabilidad sea alta para mejorar un carcter.
Si la variacin es pequea, es decir: si todos los individuos son
parecidos, no es posible escoger a individuos destacados y mejorar la
media de la poblacin.
Caso 1 Caso 2 Caso 3
Heredabilidad alta Heredabilidad alta Heredabilidad baja
Variabilidad alta Variabilidad baja Variabilidad alta
En el caso 1 de la figura anterior hay variacin y es debida a efectos
genticos heredables, en el 2 no hay variacin apenas y en el 3 hay
variacin pero se debe a causas ambientales. Existiendo heredabilidad
alta > 40 % la seleccin es rpida y mas exacta. Con valores 20 % h
2
< 40 % la seleccin requiere mtodos que sean ms exactos en
identificar a los reproductores con alto valor gentico; finalmente h
2
<
20 % se puede obtener resultados positivos en el avance gentico pero
es pequeo y toma mucho tiempo para lograr significativos avances.
En este caso se recomienda estabilizar el medio ambiente a niveles
ptimos.
P P
P
A A E E E A
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
63
2.5 HEREDABILIDAD Y VARIACION.
La heredabilidad se estima examinando el parecido entre parientes.
Los parientes se parecen por causas genticas: tienen genes comunes.
Tambin pueden parecerse por causas ambientales; por ejemplo, todos
los hermanos de padre y madre se parecen, adems de tener la misma
carga gentica por haber sido gestados en el mismo tero, con las
mismas atenciones maternas, lactacin, alimentacin, vacunaciones y
manejo comunes. Para estimar ndices genticos debemos, pues,
comparar parientes que slo se parezcan por causas genticas, como
por ejemplo padre-hijo o bien medios hermanos de padre.
Veamos un ejemplo. La covarianza entre padre e hijo puede calcularse
si se dispone de datos de ambos. Las causas de esta covarianza son
aditivas (genticas de las que se heredan): un hijo recibe - por trmino
medio - la mitad del valor aditivo de su padre (y la mitad de su
madre).
cov (Padre, hijo) =
A
Por lo tanto: 2cov (Padre, hijo) =
A
Si calculamos la covarianza observada padre-hijo para la velocidad de
crecimiento de la fibra en alpacas y nos da 20, calculamos la varianza
observada y nos da 100, la heredabilidad ser:
4 . 0
100
20 * 2
2
) (
) (
2
) , ( 2
= = = =
P
Hijo Padre
P Var
A Var
h
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
64
REPETIBILIDAD DE ALGUNOS CARACTERES EN
DIFERENTES ESPECIES ANIMALES
Especie Carcter Heredabilidad %
Alpacas Peso vivo al nacimiento 0.63*
Peso de velln grasiento 0.63*
Peso de velln limpio 0.68*
Dimetro de fibra 0.73*
Llamas Peso de velln 0.48 y 0.27**
Dimetro de fibra 0.34 y 0.28**
Longitud de fibra 0.28**
Bovino Produccin lechera 20-40***
% protenas en leche 40-70***
Intervalo entre partos 0-5***
Permetro de pechuga 30-60***
% grasa en la carcasa 20-50***
Ovino Peso vivo 20-40***
Tamao de la camada 10-30***
Fineza de la lana 20-50***
Porcino Velocidad de crecimiento 10-50***
Espesor de grasa dorsal 30-70***
Color de la carne 30-40***
Tamao de la camada 10-15***
Gallinas Produc. de huevos/ hembra 15-30***
Edad al primer huevo 20-50***
Peso del huevo 40-70***
Fertilidad 5-15***
% eclosin 5-20***
Fuente: * Frank, E. et.al (2006)
** Wuliji, T. et. al. (1999)
***. Falconer y Mackay (1996)
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
65
Obviamente el obtener datos de padres e hijos, requiere un gran
esfuerzo, y muchas veces no se dispone de ellos; pero si resulta ser
ms fcil obtener datos de medios hermanos o hermanos enteros,
consecuentemente con stos ltimos se realiza un anlisis de varianza
y tambin es posible obtener las varianzas del modelo gentico. De
este modo cuando consideramos solo medios hermanos, desde que el
componente de la varianza de machos es un cuarto de la varianza
gentica, tenemos:
HS
P
s
P
s
t
P Var
A Var
h * 4 4
4
) (
) (
2
2
2
2
2
= = = =
Si la heredabilidad es estimada de una correlacin entre hermanos
enteros, dicha estimacin puede estar sesgada, porque incluye la parte
del denominador, el efecto del medioambiente comn, el efecto de la
interaccin (mayor que en el caso de medios hermanos), los cuales se
encuentran dentro del componente de varianza entre madres.
2.6 EFECTO MATERNO.
La varianza de la combinacin de los efectos: maternal, del
medioambiente comn, y efecto de la interaccin, pueden ser
estimadas de las diferencia de las correlaciones entre hermanos
completos menos medios hermanos:
Recordemos:
2
2
P
S
HS
t
= y
2
2
P
D
FS
t
=
Entonces:
2
2 2
2
2
2
2
2
P
s d
P
s
P
d
HS FS
t t c
= = =
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
66
2.7 ESTIMACION DE COMPONENTES DE VARIANZA
Para obtener un predictor del valor gentico de los animales
candidatos a la seleccin, insesgado y de mnima varianza, se debe
conocer el valor de los parmetros genticos en su poblacin base.
Obviamente que conocer esos parmetros implica estimarlos a partir
de observaciones habitualmente desequilibradas, recogidas en
distintos ambientes, y seleccionadas.
Se han dedicado importantes esfuerzos para poder disponer de
mtodos de estimacin de componentes de varianza que, adaptndose
a las caractersticas de los datos, ofreciesen estimadores con
propiedades deseables. Fundamentalmente interesa disponer de
estimadores suficientes, que sean aplicables a modelos mixtos
desequilibrados, y tengan en cuenta la seleccin de los datos.
Existen numerosos trabajos que revisan los distintos mtodos de
estimacin de componentes de varianza existentes, por ejemplo, los de
Searle (1989), Baselga y Carabao (1993), Foulley (1990), San
Cristbal (1992), Garca-Corts (1992), Searle et al. (1992).
De los distintos mtodos de estimacin de componentes de varianza
desarrollados en estadstica clsica, entre los principales, podemos
citar los siguientes:
ANOVA, que en el caso de datos equilibrados y bajo un modelo
aleatorio, ofrece un estimador ptimo (insesgado y de varianza
mnima) pero no ocurre as en el caso de datos desequilibrados
(Searle, 1989).
Mtodos Henderson I, II y III, que son simplemente adaptaciones del
ANOVA, que permiten analizar datos desequilibrados mediante un
modelo aleatorio, un modelo mixto sin interacciones entre efectos
fijos y aleatorios, y todo tipo de modelo mixto respectivamente. No
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
67
obstante, entre otras limitaciones, presentan la de no ser adecuados
en presencia de seleccin (Searle, 1989).
Mtodo de mxima verosimilitud (ML), el cual est basado en
maximizar la verosimilitud de la muestra, ofrece estimadores con
propiedades ms tiles que los mnimo cuadrticos: consistencia,
normalidad asinttica y matriz de dispersin muestral asinttica
conocida. Sin embargo, existe una prdida de grados de libertad,
asociada a la estimacin de los efectos fijos, que conduce a
subestimar la varianza del error (Searle et al., 1992).
Mtodos de norma mnima (MINQUE) o varianza mnima
(MIVQUE), que presentan propiedades ptimas an en el caso de
datos desequilibrados, pero si las poblaciones han sido seleccionadas
y los valores de las componentes de varianza considerados a priori,
en el proceso iterativo de resolucin, no son las verdaderas, los
valores que se obtienen estn sesgados (Sorensen y Kennedy,
1984a).
Mtodo de mxima verosimilitud restringida (REML), caracterizada
por trabajar confunciones residuales de los datos libres de los
efectos fijos, y por tanto, a diferencia del mtodo ML, no subestima
la varianza residual (Searle, 1989).
Mtodo de muestreo de Gibbs, el cual se encuentra basado en los
modelos del enfoque bayesiano, usando las cadenas de Markov de
Monte Carlo (MCMC-Markov Chain Monte Carlo). Hay muchos
mtodos MCMC, como el algoritmo Metropolis-Hastings, el
muestreo Gibbs, el salto reversible, el templado simulado
simulated tempering, el muestreo del pasado sampling from the
past, etc. Sin lugar a dudas, el ms popular de ellos ha sido el
muestreo Gibbs, a pesar de que solamente puede usarse bajo ciertas
condiciones. Las primeras aplicaciones del muestreo Gibbs a la
zootecnia se refieren a 1993, y desde entonces ha habido muchos
artculos que han empleado MCMC. Una aportacin importante fue la
introduccin de medidas bayesianas para cuantificar la incertidumbre
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
68
en respuesta a la seleccin gentica, el cual es un problema en
zootecnia en el cual la combinacin de los enfoques de verosimilitud y
frecuentista apenas puede considerarse como una aproximacin cruda,
an bajo el supuesto de normalidad. El mtodo bayesiano reside en
estimar la distribucin posterior de las medidas de cambio gentico, las
cuales son funciones de los valores de cria no observables. Estos
ltimos se obtienen a partir de sus distribuciones posteriores mediante
MCMC, y con estas muestras uno obtiene muestras de la distribucin
posterior de la respuesta a la seleccin, por ejemplo. La distribucin
posterior del cambio gentico no observable se estima a partir de la
coleccin entera de muestras (Gianola, 2006)
El mtodo REML y el de Gibbs Sampling, son los ms utilizados en la
actualidad en mejora animal. Ello es as porque los estimadores
hallados son aplicables a modelos mixtos desequilibrados, permiten
utilizar fcilmente toda la informacin que contienen los datos, no
subestiman la varianza residual y, como veremos ms adelante, no
estn afectados por la existencia de determinados tipos de seleccin o,
si lo estn, lo estn menos que otros estimadores (Meyer, 1990). Sin
embargo, hay que tener en cuenta que los estimadores basados en la
verosimilitud slo son asintticamente insesgados, y que adems los
REML generalmente pierden esa propiedad por restringir su espacio
paramtrico (Searle, 1989; Foulley, 1993).
Existen otros inconvenientes al utilizar estimadores REML. Excepto
en algunos casos equilibrados, no se pueden obtener analticamente,
dado que el sistema de ecuaciones a resolver no es lineal respecto a
los componentes de varianza a estimar. Ello obliga a utilizar mtodos
iterativos basados en localizar el mximo de la funcin de
verosimilitud (Meyer, 1989), es decir, a usar algoritmos de
maximizacin. Es necesario diferenciar entre estimadores y soluciones
REML, puesto que aunque los estimadores REML fuesen insesgados,
las soluciones obtenidas mediante un mtodo iterativo no
necesariamente lo seran (Searle, 1989). Se consideran soluciones
REML las obtenidas al alcanzar la convergencencia en un proceso
iterativo; en determinadas situaciones un mtodo iterativo difcilmente
puede garantizar la convergencia en el mximo global de la funcin de
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
69
verosimilitud, siendo posible hallar varias soluciones REML para un
mismo conjunto de datos (Groeneveld y Kovac, 1990).
Hay, entre otros, dos importantes algoritmos iterativos de clculo
basados en los elementos de las ecuaciones del modelo mixto de
Henderson (Henderson, 1984): un algoritmo de desarrollo terico, el
EM (Expectation and Maximization, Dempster et al. 1977), y un
algoritmo de desarrollo emprico, el DF (Derivative Free), Graser et
al. 1987). El algoritmo DF presenta la ventaja de ser mucho menos
demandante computacionalmente pero mucho ms oscuro en cuanto a
conocer los verdaderos mecanismos que determinan las estimaciones
(Thompson y Atkins, 1990). El desarrollo de este algoritmo (Meyer,
1989), su implementacin informtica aprovechando distintas
estrategias para aumentar su eficiencia (Boldman y Van VIeck, 1991),
y el importante desarrollo informtico experimentado en la ltima
dcada, han permitido el uso generalizado de la metodologa REML
en mejora animal.
La base terica para conocer el efecto de la seleccin sobre los
parmetros genticos parte de considerar que, en una poblacin de
tamao infinito y bajo un modelo aditivo infinitesimal (Fisher, 1918),
el genotipo de un individuo se modeliza como la semisuma de los
genotipos de los padres ms una componente de recombinacin. Pese
a que la varianza aditiva de la descendencia se altera por la seleccin
de los padres, producindose un cambio temporal que desaparece
progresivamente al cesar la seleccin, la varianza de la componente de
recombinacin no se ve afectada, pues es independiente del valor de
los parentales (Bulmer, 1971). De esta forma, bajo ciertas formas de
seleccin, se pueden predecir los cambios de la varianza gentica
aditiva y, por lo tanto, conocer su incidencia sobre distintos mtodos
de estimacin.
Respecto al mtodo REML-, los resultados de algunos trabajos de
simulacin (p.ej. Sorensen y Kennedy, 1984a; Thompson y Atkins,
1990; Van der Werf y Boer, 1990; Vsscher y Thompson, 1990; Van
der Werf, 1992; Van der Werf y Thompson, 1992) y el anlisis terico
METODOLOGAS PARA ESTIMAR LOS VALORES DE CRA (EVC) Aplicaciones para el Mejoramiento Gentico de Alpacas
Edgar C. QUISPE PEA / Leopoldo ALFONSO RUIZ
70
basado en funciones de verosimiltud (Gianola et al., 1989; Im. et al.,
1989), indican que ofrece estimadores que no se ven afectados por la
seleccin de los reproductores siempre que se conozcan todas las
relaciones de parentesco, y toda la informacin utilizada en el proceso
de seleccin, o al menos una muestra aleatoria que no afecte su
distribucin. Eso significa que las estimas obtenidas en base a datos de
poblaciones sometidas a seleccin, de las que desconocemos algunas
relaciones de parentesco, estarn afectadas por la seleccin, ms
cuanta menos informacin familiar se conozca 10 (Van der Werf,
1992; Van der Werf y Thompson, 1992).
Los estimadores REML tampoco se ven afectados por la existencia de
seleccin en los animales de la poblacin base, si no hay seleccin
posterior y tratamos esos animales como efectos fijos, tal como
propusieron Graser et al. (1987). Tratar los animales base como
efectos fijos implica ignorar la informacin que aportan sobre la
variabilidad gentica de la poblacin. En una poblacin de tamao
infinito, esa informacin se puede despreciar cuando no existe
seleccin posterior, pues en ese caso la varianza gentica no se ve
afectada generacin a generacin. Por contra, cuando existe seleccin,
la varianza gentica s se ve afectada generacin a generacin,
producindose cambios que son funcin de la varianza gentica de la
poblacin base.
Cuando la poblacin base no es una muestra tomada al azar, es difcil
obtener estimaciones que no estn afectadas por la seleccin si su
descendencia tambin es seleccionada; tratar los animales base como
efectos fijos implica evitar una fuente de error, pero a la vez generar
otra que puede ser de mayor importancia (Van der Werf y Thompson,
1992).
Es importante aclarar que el efecto gentico aditivo se debe al gen
(solo) no en pares en una poblacin diploide, ni de pares de genes. Es
el gen solo el que pasa de una generacin a otra y se mantiene con su
efecto invariablemente (ese efecto se denomina valor de cra
estimado)