Академический Документы
Профессиональный Документы
Культура Документы
Gua de ejercicios
Unidad III. Formas de procesamiento de datos proveniente de
investigacin experimental
Aplicaciones bsicas para el anlisis estadstico de datos experimentales en
el programa INFOSTAT
InfoStat es un software para anlisis estadstico de aplicacin general. Cubre tanto las necesidades elementales para la obtencin
de estadsticas descriptivas y grficos para el anlisis exploratorio, como mtodos avanzados de modelacin estadstica y anlisis
multivariado. Una de sus fortalezas es la sencillez de su interfaz combinada con capacidades profesionales para el clculo y el
manejo de datos. Debido al origen universitario, el programa tiene muchas facilidades para la enseanza de la estadstica que no
son fciles en encontrar en otros programas similares. La versin en espaol es muy valorada por los usuarios, especialmente por
los estudiantes. Una propiedad casi nica entre el software estadstico es la habilidad de InfoStat se conectarse con R, una
plataforma de desarrollo de algoritmos estadsticos de dominio pblico de gran crecimiento. InfoStat de conecta con R de dos
maneras: mediante un intrprete integrado que permite ejecutar script de R sin salir del ambiente de trabajo de InfoStat y mediante
el desarrollo de aplicaciones utilizando el motor de clculo de R pero con la interfaz amigable que los usuarios esperan. Ese es el
caso del la inclusin de modelos lineales mixtos en InfoStat
Ejercicios en INFOSTAT
1. Anlisis de Varianza para un Diseo Completamente al Azar
Para realizar un anlisis de varianza en INFOSTAT se debe crear primero un archivo en el
programa Excel. A continuacin se realizar un ejercicio con los siguientes datos:
Se tienen los datos de cuatro variedades de arroz y se quiere saber si se debe aceptar que los
promedios de ellas en la poblacin no difieren entre s. Los rendimientos en kgs observados
de cuatro parcelas de cada variedad son:
Variedades
1
2
3
4
Rendimiento
31.2
18.2
26.3
28.2
28.3
33
42.1
32.3
23.5
24.4
32.3
39.9
27.8
28.3
34.5
38.2
Con base a estos datos creamos un archivo en el programa M.S. Excel el cual quedar de la
siguiente forma:
Variedad
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4
Rendimiento
23.5
31.2
18.2
27.8
24.4
26.3
28.2
28.3
32.3
28.3
33
34.5
38.9
42.1
32.3
38.2
Posterior a esto seleccionamos toda la tabla y elegimos la opcin copiar. Una vez abierto el
programa INFOSTAT vamos a Archivo, Nueva tabla y este desplegar una tabla en
blanco. Damos un Click derecho sobre esta tabla y seleccionamos la opcin Pegar
incluyendo nombre de las columnas. El programa pegara la tabla que creamos en Excel
considerando la primera fila como los nombres de la columna.
Una vez creada la tabla en el programa decidimos hacer un anlisis de varianza y damos
clic en la opcin Estadsticas y seleccionamos la opcin Anlisis de varianza. Posterior a
esto se despliega un cuadro donde nos pide definir la variable dependiente o variable de
respuesta, para este ejemplo vamos a seleccionar Rendimiento y para la variable de
clasificacin vamos a seleccionar Variedad para que el programa pueda hacer el anlisis en
base a estas especificaciones.
Damos aceptar y se despliega una ventana donde Comparaciones. En este cuadro debemos
seleccionar el tipo de prueba de comparacin de medias que deseamos que se haga en el
anlisis, el nivel de significancia y el orden de los grupos de medias que desea que aparezca
en la tabla de resultados , para este caso debemos seleccionar Duncan, con un nivel de 0.05
y en orden de lista descendente. Seleccionamos aceptar y se desplegar una ventana con
los resultados del anlisis con los datos siguientes:
Como podemos observar en os resultados el valor de p para el modelo es 0.0022 igual que
el valor de p para la variedad lo que significa que esta es la nica fuente de variacin para
el modelo usado. El valor de p = 0.0022 para la variedad indica que hay diferencias
altamente significativas con un nivel de confianza de 99.78%. El valor de R2 = 0.69 indica
que el 69% de los datos se ajustan al modelo. El CV (Coeficiente de Variacin) es de 12.57.
Recuerde que coeficientes mayores de 30 indican que existe problema con el modelo que se
est aplicando a los datos o en algunos casos la muestra tomada es muy pequea.
La prueba de Duncan a las medias indica los grupos formados de acuerdo a la separacin de
medias. La N indica el nmero de datos tomados para realizar la media. En este caso la
variedad 4 es diferentes s la variedad 2 y 1, y la variedad 3 es diferente a la variedad 4. La
variedad 3 y cuatro resultaron con los mejores promedios.
Algo importante que se debe tomar en cuenta que en la mayora de pruebas de comparacin
de medias se requiere que los tratamientos tenga un mismo nmero de observaciones.
1
25.4
34.2
21.2
39.9
2
34.3
38.8
32.1
45.8
Tratamientos
3
23.4
28.2
21.2
34.3
4
28.3
28.2
26.2
32.3
5
12.2
14.2
14.5
19.3
Tratamiento Rendimiento
1
25.4
2
34.3
3
23.4
4
28.3
5
12.2
1
34.2
2
38.8
3
28.2
4
28.2
5
14.2
1
21.2
2
32.1
3
21.2
4
26.2
5
14.5
1
39.9
2
45.8
3
34.3
4
32.3
5
19.3
Se procede de igual manera que se hizo para el DCA a diferencia que en este anlisis para
BCA se incluye como variable de clasificacin a Bloque y Tratamiento. La ventana de
resultados muestra los siguientes datos.
Anlisis de la varianza
Variable
N
Rendimiento 20
R
0.94
R Aj CV
0.90 10.13
B
C
C
Test:Duncan Alfa:=0.05
Error: 7.8751 gl: 12
Tratamiento Medias
n
2
37.75
4
1
30.18
4
4
28.75
4
3
26.78
4
5
15.05
4
B
B
B
C
Como se puede observar en la tabla de anlisis de varianza existe diferencia entre los
bloques lo que indica que el bloqueo hizo efecto en el modelo (era necesario bloquear).
Adems se puede observar que existe diferencia entre los tratamientos.
La prueba de separacin de medias de Duncan indica que la media del tratamiento 2 es
diferente a las dems. En la parte inferior se muestra que el tratamiento 5 tambin es
diferente a los dems. La media de los tratamientos 1,3 y 4 no son diferentes entre s, pero
s diferentes ala media de los tratamiento 2 y del 5.
3. Diseo de Cuadrado Latino
Debemos recordar que el cuadrado latino se usa para bloquear gradientes de fertilidad en
dos sentidos por tanto se debe formar bloques en dos direcciones. El uso de CL aumenta la
precisin en los experimentos
Para crear un archivo de un diseo de cuadrado latino en Excel procederemos de igual
manera que lo hicimos anteriormente. Supongamos que tenemos un diseo de CL que tiene
cinco tratamientos (las letras indican las variedades y el valor indica los rendimientos de
maz por parcela).
FILAS
1
2
3
4
5
1
C(32)
A(28)
E(40)
D(39)
B(32)
2
A(23)
C(36)
D(37)
B(31)
E(45)
COLUMNAS
3
B(24)
D(33)
A(31)
E(43)
C(43)
4
E(34)
B(32)
C(39)
A(33)
D(40)
5
D(28)
E(38)
B(26)
C(41)
A(35)
Columnas
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
Tratamiento Rendimiento
C
32
A
23
B
24
E
34
D
28
A
28
C
36
D
33
B
32
E
38
E
40
D
37
A
31
C
39
B
26
D
39
B
31
E
43
A
33
C
41
B
32
E
45
C
43
D
40
A
35
Copiamos este archivo y lo pegamos, incluyendo el nombre de las columnas, en una nueva
tabla de INFOSTAT. Posterior hacemos el anlisis de varianza considerando filas, columnas
y tratamientos como variables de clasificacin y rendimiento como variable como variable
dependiente (variable de respuesta); lo dems procedemos de igual manera que en los
ejercicios anteriores. La ventana de los resultados nos muestra los siguientes datos:
Variable
N
Rendimiento 25
R
0.96
R Aj CV
0.93 4.67
F.V.
Modelo
Filas
Columnas
Tratamiento
Error
Total
SC
835.12
347.84
11.04
476.24
31.12
866.24
gl
12
4
4
4
12
24
Test:Duncan Alfa:=0.05
Error: 2.5933 gl: 12
Filas Medias
n
5
39.00
5
A
4
37.40
5
A
3
34.60
5
2
33.40
5
1
28.20
5
CM
69.59
86.96
2.76
119.06
2.59
B
B
F
26.84
33.53
1.06
45.91
p-valor
<0.0001
<0.0001
0.4159
<0.0001
Test:Duncan Alfa:=0.05
Error: 2.5933 gl: 12
Columnas
Medias
n
4
35.60
5
3
34.80
5
2
34.40
5
1
34.20
5
5
33.60
5
A
A
A
A
A
Test:Duncan Alfa:=0.05
Error: 2.5933 gl: 12
Tratamiento Medias
n
E
40.00
5
C
38.20
5
D
35.40
5
A
30.00
5
B
29.00
5
A
A
B
C
C
De los resultados de la prueba de Duncan se observa que las medias de los tratamientos E y
C no difieren entre si, pero son diferentes a las medias D, A y B. La media D es diferente a
todas las dems. Las medias de A y B son iguales entre s, pero diferentes a las medias E, C
y D.
4. Arreglos factoriales
Los arreglos factoriales no son propiamente diseos experimentales sino una posibilidad
adecuar un diseo BCA o DCA cuando queremos estudiar ms de un factor. En otras
palabras permiten estudiar ms de un factor con poco trabajo adicional, aumenta la
cobertura y utilidad de los resultados al proveer informacin sobre las interacciones de los
factores en prueba.
8
Para este ejemplo consideremos un arreglo factorial tres variedades de caa de azcar (V) y
tres niveles de Nitrgeno, conducido utilizando un diseo BCA con dos repeticiones
(bloques).
Cuando se analizan los resultados del experimento se pueden hacer las siguientes
comparaciones:
a) Comparaciones entre variedades
b) Comparaciones entre niveles de Nitrgeno
c) la interaccin de variedad y Nitrgeno
Las dos primeras comparaciones son entre efectos principales. La presencia ausencia de
efectos principales no dice nada acerca de la presencia o ausencia de interacciones y
viceversa, por lo tanto se deben considerar separadamente.
Si el anlisis presenta interaccin significativa implica que los efectos de los factores no
son independientes entre s. Por lo tanto no se puede concluir que el mejor tratamiento
corresponde a la combinacin de la variedad con el mayor promedio y el nivel de nitrgeno
con el promedio ms alto. Es necesario estudiar ms a fondo como se comporta cada
variedad con los diferentes niveles de fertilizacin, o los niveles de fertilizacin con cada
variedad. Podemos realizar el anlisis con los siguientes datos.
Fertilizacin
Bloque I
Bloque II
F0
F1
F2
F0
F1
F2
V0
66.52
68.98
75.95
56.50
58.95
66.95
Variedades
V1
61.45
62.55
57.90
53.45
51.55
47.90
V2
68.60
64.54
68.09
58.50
54.54
58.19
Bloque
I
I
I
I
I
I
I
I
I
II
II
II
II
II
II
II
II
II
F0
F0
F1
F1
F1
F2
F2
F2
F0
F0
F0
F1
F1
F1
F2
F2
F2
V1
V3
V0
V1
V3
V0
V1
V3
V0
V1
V3
V0
V1
V3
V0
V1
V3
61.45
68.6
68.98
62.55
64.54
75.95
57.9
68.09
56.5
53.45
58.5
58.95
51.55
54.54
66.95
47.9
58.19
10
Dentro del cuadro de especificaciones del modelo, al final se deber digitar (bien escrito)
Fertilizacin*Variedades
11
N
18
R
1.00
R Aj
0.99
CV
0.96
12
n
6
6
6
A
A
B
B
B
C
D
E
E
E
F
Aunque los efectos principales variedad (0.0001) y fertilizante (0.0004), son significativos
no se le puede estudiar por separado, debido a que la mejor dosis de fertilizacin depende
de la variedad que se est investigando, segn se deduce que la interaccin Variedad fertilizante es significativa (0.0001). lo ms recomendable en este caso sera hacer un
anlisis de la tendencia de la respuesta de cada variedad a la fertilizacin; para esto se debe
calcular los componentes lineal y cuadrtico para cada variedad.
Si la interaccin no hubiese sido significativa, hubiese sido necesario hacer comparacin
de las medias de las variedades y ajustar curvas de respuestas para los niveles de
fertilizacin del promedio de las variedades.
5. Diseos de parcelas divididas
La necesidad de utilizar el diseo de parcelas divididas, surge cuando se aplica dos o ms
tipos de en arreglos factoriales, si los niveles de un factor pueden aplicarse a parcelas
relativamente pequeas mientras que los otros puedan aplicarse en parcelas ms grandes.
Un ejemplo de este es cuando se prueban diferentes niveles de irrigacin en parcelas y
factores tales como variedades o fertilizantes son aplicados a las parcelas pequeas.
Supngase que se tiene un experimento con dos niveles de irrigacin (alta y moderada) y
cuatro variedades de caa en cuatro bloques. Los datos del rendimiento de la caa son:
13
Irrigacin
Bloque I
Bloque II
Bloque III
Bloque IV
Alta
Moderada
Alta
Moderada
Alta
Moderada
Alta
Moderada
Variedad
1
123.2
118.2
128.2
119.2
118.2
111.2
128.2
113.2
2
132.3
123.2
138.3
120.2
122.3
117.2
123.3
122.2
3
123.2
115.2
128.2
117.2
121.2
113.2
128.2
114.2
4
128.8
116.3
125.8
121.3
124.8
113.3
132.8
116.3
La tabla para realizar el anlisis de varianza que se debe realizar en INFOSTAT quedar de
la siguiente manera:
Bloque
I
I
I
I
I
I
I
I
II
II
II
II
II
II
II
II
III
III
III
III
III
III
III
III
IV
Irrigacin
Variedad
Rendimiento
Alta
Alta
Alta
Alta
Moderada
Moderada
Moderada
Moderada
Alta
Alta
Alta
Alta
Moderada
Moderada
Moderada
Moderada
Alta
Alta
Alta
Alta
Moderada
Moderada
Moderada
Moderada
Alta
123.2
132.3
123.2
128.8
118.2
123.2
115.2
116.3
128.2
138.3
128.2
125.8
119.2
120.2
117.2
121.3
118.2
122.3
121.2
124.8
111.2
117.2
113.2
113.3
128.2
14
Bloque
IV
IV
IV
IV
IV
IV
IV
Irrigacin
Variedad
Rendimiento
Alta
Alta
Alta
Moderada
Moderada
Moderada
Moderada
123.3
128.2
132.8
113.2
122.2
114.2
116.3
Para realizar el anlisis de varianza procedemos de igual manera que en los anlisis
anteriores. En este caso debemos seleccionar las interacciones de las quenos interesan dos
(Bloque*Irrigacin; Irrigacin*Variedad) que se constituyen como nuevas fuentes de
variacin en comparacin con los anlisis de BCA y DCA. Para seleccionar las
interacciones debemos dar click opcin de Interacciones del anlisis de varianza. Para este
caso nos interesa un modelo que considere las siguientes fuentes de variacin:
Bloque
Irrigacin
Variedad
Bloque*Irrigacin
Irrigacin*Variedad.
La salida de datos en la ventana de resultados es la siguiente:
Anlisis de la varianza
Variable
N
Rendimiento 32
R
0.85
R Aj CV
0.75 2.70
A
A
A
F
p-valor
8.00 <0.0001
6.60 0.0033
69.64 <0.0001
4.00 0.0241
0.56 0.6504
0.31 0.8188
15
Test:Duncan Alfa:=0.05
Error: 10.8368 gl: 18
Irrigacin Medias
n
Alta
126.69
16
Moderada
116.98
16
A
B
Test:Duncan Alfa:=0.05
Error: 10.8368 gl: 18
Variedad
Medias
n
2
124.88
8
4
122.43
8
3
120.08
8
1
119.95
8
A
A
B
B
B
Test:Duncan Alfa:=0.05
Error: 10.8368 gl: 18
Bloque
Irrigacin
II
Alta
IV
Alta
I
Alta
III
Alta
II
Moderada
I
Moderada
IV
Moderada
III
Moderada
Medias
130.13
128.13
126.88
121.63
119.48
118.23
116.48
113.73
n
4
4
4
4
4
4
4
4
A
A
A
B
B
B
B
C
C
C
Test:Duncan Alfa:=0.05
Error: 10.8368 gl: 18
Irrigacin Variedad
Alta
2
Alta
4
Alta
3
Alta
1
Moderada
2
Moderada
4
Moderada
1
Moderada
3
Medias
129.05
128.05
125.20
124.45
120.70
116.80
115.45
114.95
n
4
4
4
4
4
4
4
4
A
A
A
A
B
B
B
C
C
D
D
D
16
Crecimiento
0.36
0.09
0.67
0.44
0.72
0.24
0.33
0.61
0.64
0.65
0.47
0.6
0.51
Copiamos esta tabla y la pegamos incluyendo los nombres de las columnas en una tabla
nueva en INFOSTAT. Vamos a Anlisis y seleccionamos regresin lineal. Asignamos como
Variable dependiente a Crecimiento y Variable regresora o independiente a Volumen. La
salida en este anlisis genera tres ventanas: una sobre anlisis de varianza de la regresin, la
segunda un grafico representado la regresin en un plano x,y y la tercera es una ventana de
herramientas para mejorar la calidad del grfico al gusto del investigador. Las tres ventanas
se muestran en la siguiente imagen.
17
y = a+bX.
y = Crecimiento
a = Intercepto
b = Coeficiente de regresin lineal del volumen
x = Volumen
Considerando el valor estimado de los parmetros y su significancia en el resultado de el
anlisis de varianza, el modelo de regresin lineal quedara expresado de la siguiente
manera:
18
Rendimiento
12.5
18.6
24.6
28.3
21.3
14.4
Este cuadro se debe copiar y se pega incluyendo los nombres de las columnas
Y = a + b*x +c*x2
y=
Rendimiento
a = Intercepto (Const)
b = Coeficiente de regresin lineal
c = Coeficiente de regresin cuadrtica
x = Dosis de fertilizante
Rendimiento = a + b (Dosis de fertilizante) + c (Dosis de fertilizante)2
Una vez teniendo la tabla de datos seleccionamos la opcin de Anlisis de INFOSTAT y
hacemos click en Regresin no lineal, definimos a variable dependiente como
Rendimiento, y Dosis como la variable independiente. Se presenta una tabla donde se nos
pide la estructura de la regresin que queremos probar. Para este caso digitaremos la
siguiente estructura
a+b*Dosis+c*(Dosis*Dosis)
Posteriormente damos clic en Verificar la sintaxis del modelo, y Aceptar. La salida del
programa es la siguiente:
19
Se puede observar que el programa analiz los datos por medio de una regresin cuadrtica,
adems produce un grfico que representa la relacin entre las variables, con una curva
ajustada
El valor de p (pvalor)
demuestra que todos los parmetros son significativos por tanto el modelo cuadrtico que
representa esta regresin quedar de la siguiente forma:
20
6D
9D
12D
11.4
11
11.5
10.7 11.1
11.7
10.8 11
11.3
11.4 11.3
11.1
13 12.8
12.6
12.6 12.6
12.9
12.9 12.9
13.2
13.1 13
13.1
12.8 12.1
12.4
12.3 12.9
12.4
12.7 12.8
12
12.5 12.7
12.9
11.2 9.9
10.3
11.4 10.6
10.8
10.5 11.2
11.4
11 10.7
11
11.8 11.4
11.2
11 11.3
10.8
11.7 11.1
11
11.9 11.4
11.3
15D
11.1
10.9
11.1
11.5
12.8
13
13.1
12.9
12.3
12.1
12.5
12.4
10.3
11
11.1
10.9
11
10.9
10.7
11
18D
10.8
11.5
11.4
11.5
13.1
13.1
13.2
13
12.8
12.9
12.3
12
10.7
11.2
11
11.3
11.3
11.5
11.6
11
21D 24D
11.2 11.3
11.3 11.5
11.1 11.3
11.2 11.6
13
13.1
13.2
13
12.9
13
12.8 13.2
12.8 12.5
12.7 12.9
12.4 12.8
12.7 12.3
11.1 11.2
12.1 11.8
11.7 11.4
11.6 11.3
12
11.3
11.2 11.4
11
11.5
11.7 11.7
27D
11.1
11.4
11.6
11.3
13
12.8
12.7
12.9
12.4
11.9
12.3
12.1
11.3
11.4
11.7
11.4
11.1
11.2
11.3
11.9
30D
11.6
11.3
11.2
11.4
12.9
13.1
12.9
12.7
12.2
12.1
12.1
11.9
11.6
11
11.3
11.9
11.5
11.7
11.6
11.5
se tomo los datos como Variables y seleccionamos a tratamiento como los Perfiles que
queremos clasificar los datos acomo se muestra en la siguiente figura.
Ttulo
13.11
Escala comn
12.47
11.83
11.19
10.55
C3
C6
C9
C12
C15
C18
C21
C24
C27
C30
grfico, es importante
estos y se puede hacer
Herramientas grficas
INFOSTAT.
22
23