Вы находитесь на странице: 1из 23

Universidad Catlica del Trpico Seco

Pbro. Francisco Luis Espinoza Pineda


Fundacin 1968-2014

Gua de ejercicios
Unidad III. Formas de procesamiento de datos proveniente de
investigacin experimental
Aplicaciones bsicas para el anlisis estadstico de datos experimentales en
el programa INFOSTAT

InfoStat es un software para anlisis estadstico de aplicacin general. Cubre tanto las necesidades elementales para la obtencin
de estadsticas descriptivas y grficos para el anlisis exploratorio, como mtodos avanzados de modelacin estadstica y anlisis
multivariado. Una de sus fortalezas es la sencillez de su interfaz combinada con capacidades profesionales para el clculo y el
manejo de datos. Debido al origen universitario, el programa tiene muchas facilidades para la enseanza de la estadstica que no
son fciles en encontrar en otros programas similares. La versin en espaol es muy valorada por los usuarios, especialmente por
los estudiantes. Una propiedad casi nica entre el software estadstico es la habilidad de InfoStat se conectarse con R, una
plataforma de desarrollo de algoritmos estadsticos de dominio pblico de gran crecimiento. InfoStat de conecta con R de dos
maneras: mediante un intrprete integrado que permite ejecutar script de R sin salir del ambiente de trabajo de InfoStat y mediante
el desarrollo de aplicaciones utilizando el motor de clculo de R pero con la interfaz amigable que los usuarios esperan. Ese es el
caso del la inclusin de modelos lineales mixtos en InfoStat

Ing. Allan Silva Benavides


Estel, abril del 2014

Ejercicios en INFOSTAT
1. Anlisis de Varianza para un Diseo Completamente al Azar
Para realizar un anlisis de varianza en INFOSTAT se debe crear primero un archivo en el
programa Excel. A continuacin se realizar un ejercicio con los siguientes datos:
Se tienen los datos de cuatro variedades de arroz y se quiere saber si se debe aceptar que los
promedios de ellas en la poblacin no difieren entre s. Los rendimientos en kgs observados
de cuatro parcelas de cada variedad son:
Variedades
1
2
3
4

Rendimiento
31.2
18.2
26.3
28.2
28.3
33
42.1
32.3

23.5
24.4
32.3
39.9

27.8
28.3
34.5
38.2

Con base a estos datos creamos un archivo en el programa M.S. Excel el cual quedar de la
siguiente forma:
Variedad
1
1
1
1
2
2
2
2
3
3
3
3
4
4
4
4

Rendimiento
23.5
31.2
18.2
27.8
24.4
26.3
28.2
28.3
32.3
28.3
33
34.5
38.9
42.1
32.3
38.2

Posterior a esto seleccionamos toda la tabla y elegimos la opcin copiar. Una vez abierto el
programa INFOSTAT vamos a Archivo, Nueva tabla y este desplegar una tabla en
blanco. Damos un Click derecho sobre esta tabla y seleccionamos la opcin Pegar
incluyendo nombre de las columnas. El programa pegara la tabla que creamos en Excel
considerando la primera fila como los nombres de la columna.

Una vez creada la tabla en el programa decidimos hacer un anlisis de varianza y damos
clic en la opcin Estadsticas y seleccionamos la opcin Anlisis de varianza. Posterior a
esto se despliega un cuadro donde nos pide definir la variable dependiente o variable de
respuesta, para este ejemplo vamos a seleccionar Rendimiento y para la variable de
clasificacin vamos a seleccionar Variedad para que el programa pueda hacer el anlisis en
base a estas especificaciones.

Damos aceptar y se despliega una ventana donde Comparaciones. En este cuadro debemos
seleccionar el tipo de prueba de comparacin de medias que deseamos que se haga en el
anlisis, el nivel de significancia y el orden de los grupos de medias que desea que aparezca
en la tabla de resultados , para este caso debemos seleccionar Duncan, con un nivel de 0.05
y en orden de lista descendente. Seleccionamos aceptar y se desplegar una ventana con
los resultados del anlisis con los datos siguientes:

Como podemos observar en os resultados el valor de p para el modelo es 0.0022 igual que
el valor de p para la variedad lo que significa que esta es la nica fuente de variacin para
el modelo usado. El valor de p = 0.0022 para la variedad indica que hay diferencias
altamente significativas con un nivel de confianza de 99.78%. El valor de R2 = 0.69 indica
que el 69% de los datos se ajustan al modelo. El CV (Coeficiente de Variacin) es de 12.57.
Recuerde que coeficientes mayores de 30 indican que existe problema con el modelo que se
est aplicando a los datos o en algunos casos la muestra tomada es muy pequea.
La prueba de Duncan a las medias indica los grupos formados de acuerdo a la separacin de
medias. La N indica el nmero de datos tomados para realizar la media. En este caso la
variedad 4 es diferentes s la variedad 2 y 1, y la variedad 3 es diferente a la variedad 4. La
variedad 3 y cuatro resultaron con los mejores promedios.
Algo importante que se debe tomar en cuenta que en la mayora de pruebas de comparacin
de medias se requiere que los tratamientos tenga un mismo nmero de observaciones.

Cuando se trata de tratamientos con efecto aleatorio o cuantitativo es preferible ajustar


modelos de regresin a los datos
2. Anlisis de varianza para Diseos de Bloque Completo al Azar (BCA)
Para crear el archivo en INFOSTAT procederemos de la misma manera que el DCA visto
anteriormente. Utilicemos los datos del siguiente experimento.
Se evaluaron cinco variedades de maz, las cuales se repitieron en cuatro bloques. Los datos
en kg/parcela son los siguientes:
Bloque
1
2
3
4

1
25.4
34.2
21.2
39.9

2
34.3
38.8
32.1
45.8

Tratamientos
3
23.4
28.2
21.2
34.3

4
28.3
28.2
26.2
32.3

5
12.2
14.2
14.5
19.3

El archivo en Excel quedara de la siguiente manera (este sera el que se va a pegar en la


tabla nueva del INFOSTAT, incluyendo el nombre de las columnas).
Bloque
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
4
4
4
4
4

Tratamiento Rendimiento
1
25.4
2
34.3
3
23.4
4
28.3
5
12.2
1
34.2
2
38.8
3
28.2
4
28.2
5
14.2
1
21.2
2
32.1
3
21.2
4
26.2
5
14.5
1
39.9
2
45.8
3
34.3
4
32.3
5
19.3

Se procede de igual manera que se hizo para el DCA a diferencia que en este anlisis para
BCA se incluye como variable de clasificacin a Bloque y Tratamiento. La ventana de
resultados muestra los siguientes datos.
Anlisis de la varianza

Variable
N
Rendimiento 20

R
0.94

R Aj CV
0.90 10.13

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V.
SC
gl
CM
F
p-valor
Modelo
1453.74
7
207.68
26.37 <0.0001
Bloque
377.30
3
125.77
15.97 0.0002
Tratamiento 1076.44
4
269.11
34.17 <0.0001
Error
94.50
12
7.88
Total
1548.24
19
Test:Duncan Alfa:=0.05
Error: 7.8751 gl: 12
Bloque
Medias
n
4
34.32
5
2
28.72
5
1
24.72
5
3
23.04
5

B
C
C

Letras distintas indican diferencias significativas(p<= 0.05)

Test:Duncan Alfa:=0.05
Error: 7.8751 gl: 12
Tratamiento Medias
n
2
37.75
4
1
30.18
4
4
28.75
4
3
26.78
4
5
15.05
4

B
B
B
C

Letras distintas indican diferencias significativas(p<= 0.05)

Como se puede observar en la tabla de anlisis de varianza existe diferencia entre los
bloques lo que indica que el bloqueo hizo efecto en el modelo (era necesario bloquear).
Adems se puede observar que existe diferencia entre los tratamientos.
La prueba de separacin de medias de Duncan indica que la media del tratamiento 2 es
diferente a las dems. En la parte inferior se muestra que el tratamiento 5 tambin es
diferente a los dems. La media de los tratamientos 1,3 y 4 no son diferentes entre s, pero
s diferentes ala media de los tratamiento 2 y del 5.
3. Diseo de Cuadrado Latino
Debemos recordar que el cuadrado latino se usa para bloquear gradientes de fertilidad en
dos sentidos por tanto se debe formar bloques en dos direcciones. El uso de CL aumenta la
precisin en los experimentos
Para crear un archivo de un diseo de cuadrado latino en Excel procederemos de igual
manera que lo hicimos anteriormente. Supongamos que tenemos un diseo de CL que tiene
cinco tratamientos (las letras indican las variedades y el valor indica los rendimientos de
maz por parcela).

FILAS
1
2
3
4
5

1
C(32)
A(28)
E(40)
D(39)
B(32)

2
A(23)
C(36)
D(37)
B(31)
E(45)

COLUMNAS
3
B(24)
D(33)
A(31)
E(43)
C(43)

4
E(34)
B(32)
C(39)
A(33)
D(40)

5
D(28)
E(38)
B(26)
C(41)
A(35)

Basndose en estos datos creamos un cuadro en MS Excel el cual quedara de la siguiente


manera:
Filas
1
1
1
1
1
2
2
2
2
2
3
3
3
3
3
4
4
4
4
4
5
5
5
5
5

Columnas
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5
1
2
3
4
5

Tratamiento Rendimiento
C
32
A
23
B
24
E
34
D
28
A
28
C
36
D
33
B
32
E
38
E
40
D
37
A
31
C
39
B
26
D
39
B
31
E
43
A
33
C
41
B
32
E
45
C
43
D
40
A
35

Copiamos este archivo y lo pegamos, incluyendo el nombre de las columnas, en una nueva
tabla de INFOSTAT. Posterior hacemos el anlisis de varianza considerando filas, columnas
y tratamientos como variables de clasificacin y rendimiento como variable como variable
dependiente (variable de respuesta); lo dems procedemos de igual manera que en los
ejercicios anteriores. La ventana de los resultados nos muestra los siguientes datos:
Variable
N
Rendimiento 25

R
0.96

R Aj CV
0.93 4.67

Cuadro de Anlisis de la Varianza (SC tipo I)

F.V.
Modelo
Filas
Columnas
Tratamiento
Error
Total

SC
835.12
347.84
11.04
476.24
31.12
866.24

gl
12
4
4
4
12
24

Test:Duncan Alfa:=0.05
Error: 2.5933 gl: 12
Filas Medias
n
5
39.00
5
A
4
37.40
5
A
3
34.60
5
2
33.40
5
1
28.20
5

CM
69.59
86.96
2.76
119.06
2.59

B
B

F
26.84
33.53
1.06
45.91

p-valor
<0.0001
<0.0001
0.4159
<0.0001

Letras distintas indican diferencias significativas(p<= 0.05)

Test:Duncan Alfa:=0.05
Error: 2.5933 gl: 12
Columnas
Medias
n
4
35.60
5
3
34.80
5
2
34.40
5
1
34.20
5
5
33.60
5

A
A
A
A
A

Letras distintas indican diferencias significativas(p<= 0.05)

Test:Duncan Alfa:=0.05
Error: 2.5933 gl: 12
Tratamiento Medias
n
E
40.00
5
C
38.20
5
D
35.40
5
A
30.00
5
B
29.00
5

A
A

B
C
C

Letras distintas indican diferencias significativas(p<= 0.05)

De los resultados de la prueba de Duncan se observa que las medias de los tratamientos E y
C no difieren entre si, pero son diferentes a las medias D, A y B. La media D es diferente a
todas las dems. Las medias de A y B son iguales entre s, pero diferentes a las medias E, C
y D.

4. Arreglos factoriales
Los arreglos factoriales no son propiamente diseos experimentales sino una posibilidad
adecuar un diseo BCA o DCA cuando queremos estudiar ms de un factor. En otras
palabras permiten estudiar ms de un factor con poco trabajo adicional, aumenta la
cobertura y utilidad de los resultados al proveer informacin sobre las interacciones de los
factores en prueba.
8

Para este ejemplo consideremos un arreglo factorial tres variedades de caa de azcar (V) y
tres niveles de Nitrgeno, conducido utilizando un diseo BCA con dos repeticiones
(bloques).
Cuando se analizan los resultados del experimento se pueden hacer las siguientes
comparaciones:
a) Comparaciones entre variedades
b) Comparaciones entre niveles de Nitrgeno
c) la interaccin de variedad y Nitrgeno
Las dos primeras comparaciones son entre efectos principales. La presencia ausencia de
efectos principales no dice nada acerca de la presencia o ausencia de interacciones y
viceversa, por lo tanto se deben considerar separadamente.
Si el anlisis presenta interaccin significativa implica que los efectos de los factores no
son independientes entre s. Por lo tanto no se puede concluir que el mejor tratamiento
corresponde a la combinacin de la variedad con el mayor promedio y el nivel de nitrgeno
con el promedio ms alto. Es necesario estudiar ms a fondo como se comporta cada
variedad con los diferentes niveles de fertilizacin, o los niveles de fertilizacin con cada
variedad. Podemos realizar el anlisis con los siguientes datos.
Fertilizacin
Bloque I
Bloque II

F0
F1
F2
F0
F1
F2

V0
66.52
68.98
75.95
56.50
58.95
66.95

Variedades
V1
61.45
62.55
57.90
53.45
51.55
47.90

V2
68.60
64.54
68.09
58.50
54.54
58.19

El archivo en MS Excel quedar de la siguiente manera:

Bloque
I

Fertilizacin Variedades Rendimiento


F0
V0
66.25

I
I
I
I
I
I
I
I
II
II
II
II
II
II
II
II
II

F0
F0
F1
F1
F1
F2
F2
F2
F0
F0
F0
F1
F1
F1
F2
F2
F2

V1
V3
V0
V1
V3
V0
V1
V3
V0
V1
V3
V0
V1
V3
V0
V1
V3

61.45
68.6
68.98
62.55
64.54
75.95
57.9
68.09
56.5
53.45
58.5
58.95
51.55
54.54
66.95
47.9
58.19

Se selecciona esta tabla y se pega en el programa INFOSTAT. Se procede de igual manera


que los anteriores a diferencia que en esta tabla se tomar como variables de clasificacin a
los bloques, fertilizacin y variedades; y como variable dependiente (variable de respuesta)
se tomar el rendimiento.

10

Dentro del cuadro de especificaciones del modelo, al final se deber digitar (bien escrito)
Fertilizacin*Variedades

Luego pinchar mostrar medias segn, prueba de Duncan y aceptar.

11

La salida en la ventana de resultados muestra los siguientes datos:


F:\DATOS EJERCICIOS INFOSTAT\arreglos factoriales.IDB: 10/03/1997 - 04:14:49 p.m.
Anlisis de la varianza
Variable
Rendimiento

N
18

R
1.00

R Aj
0.99

CV
0.96

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V.
SC
gl
CM
F
p-valor
Modelo
877.95 9
97.55 281.95 <0.0001
Bloque
428.07 1
428.07 1237.25 <0.0001
Fertilizacin
17.24 2
8.62
24.91 0.0004
Variedades
295.52 2
147.76 427.07 <0.0001
Fertilizacin*Varieda..
137.12 4
34.28
99.08 <0.0001
Error
2.77
8
0.35
Total
880.72 17
Test: LSD Fisher Alfa:=0.05 DMS:=0.63942
Error: 0.3460 gl: 8
Bloque Medias n
II
56.28 9
A
I
66.03 9
B
Letras distintas indican diferencias significativas(p<= 0.05)

Test: LSD Fisher Alfa:=0.05 DMS:=0.78312

12

Error: 0.3460 gl: 8


Fertilizacin
Medias
F1
60.19
F0
60.79
F2
62.50

n
6
6
6

A
A
B

Letras distintas indican diferencias significativas(p<= 0.05)

Test: LSD Fisher Alfa:=0.05 DMS:=0.78312


Error: 0.3460 gl: 8
Variedades
Medias n
V1
55.80 6
A
V3
62.08 6
B
V0
65.60 6
C
Letras distintas indican diferencias significativas(p<= 0.05)

Test: LSD Fisher Alfa:=0.05 DMS:=1.35641


Error: 0.3460 gl: 8
Fertilizacin
Variedades
Medias n
F2
V1
52.90 2
A
F1
V1
57.05 2
F0
V1
57.45 2
F1
V3
59.54 2
F0
V0
61.38 2
F2
V3
63.14 2
F0
V3
63.55 2
F1
V0
63.97 2
F2
V0
71.45 2

B
B
C
D
E
E
E
F

Letras distintas indican diferencias significativas(p<= 0.05)

Aunque los efectos principales variedad (0.0001) y fertilizante (0.0004), son significativos
no se le puede estudiar por separado, debido a que la mejor dosis de fertilizacin depende
de la variedad que se est investigando, segn se deduce que la interaccin Variedad fertilizante es significativa (0.0001). lo ms recomendable en este caso sera hacer un
anlisis de la tendencia de la respuesta de cada variedad a la fertilizacin; para esto se debe
calcular los componentes lineal y cuadrtico para cada variedad.
Si la interaccin no hubiese sido significativa, hubiese sido necesario hacer comparacin
de las medias de las variedades y ajustar curvas de respuestas para los niveles de
fertilizacin del promedio de las variedades.
5. Diseos de parcelas divididas
La necesidad de utilizar el diseo de parcelas divididas, surge cuando se aplica dos o ms
tipos de en arreglos factoriales, si los niveles de un factor pueden aplicarse a parcelas
relativamente pequeas mientras que los otros puedan aplicarse en parcelas ms grandes.
Un ejemplo de este es cuando se prueban diferentes niveles de irrigacin en parcelas y
factores tales como variedades o fertilizantes son aplicados a las parcelas pequeas.
Supngase que se tiene un experimento con dos niveles de irrigacin (alta y moderada) y
cuatro variedades de caa en cuatro bloques. Los datos del rendimiento de la caa son:

13

Irrigacin
Bloque I
Bloque II
Bloque III
Bloque IV

Alta
Moderada
Alta
Moderada
Alta
Moderada
Alta
Moderada

Variedad
1
123.2
118.2
128.2
119.2
118.2
111.2
128.2
113.2

2
132.3
123.2
138.3
120.2
122.3
117.2
123.3
122.2

3
123.2
115.2
128.2
117.2
121.2
113.2
128.2
114.2

4
128.8
116.3
125.8
121.3
124.8
113.3
132.8
116.3

La tabla para realizar el anlisis de varianza que se debe realizar en INFOSTAT quedar de
la siguiente manera:
Bloque
I
I
I
I
I
I
I
I
II
II
II
II
II
II
II
II
III
III
III
III
III
III
III
III
IV

Irrigacin

Variedad

Rendimiento

Alta

Alta

Alta

Alta

Moderada

Moderada

Moderada

Moderada

Alta

Alta

Alta

Alta

Moderada

Moderada

Moderada

Moderada

Alta

Alta

Alta

Alta

Moderada

Moderada

Moderada

Moderada

Alta

123.2
132.3
123.2
128.8
118.2
123.2
115.2
116.3
128.2
138.3
128.2
125.8
119.2
120.2
117.2
121.3
118.2
122.3
121.2
124.8
111.2
117.2
113.2
113.3
128.2

14

Bloque
IV
IV
IV
IV
IV
IV
IV

Irrigacin

Variedad

Rendimiento

Alta

Alta

Alta

Moderada

Moderada

Moderada

Moderada

123.3
128.2
132.8
113.2
122.2
114.2
116.3

Para realizar el anlisis de varianza procedemos de igual manera que en los anlisis
anteriores. En este caso debemos seleccionar las interacciones de las quenos interesan dos
(Bloque*Irrigacin; Irrigacin*Variedad) que se constituyen como nuevas fuentes de
variacin en comparacin con los anlisis de BCA y DCA. Para seleccionar las
interacciones debemos dar click opcin de Interacciones del anlisis de varianza. Para este
caso nos interesa un modelo que considere las siguientes fuentes de variacin:
Bloque
Irrigacin
Variedad
Bloque*Irrigacin
Irrigacin*Variedad.
La salida de datos en la ventana de resultados es la siguiente:
Anlisis de la varianza
Variable
N
Rendimiento 32

R
0.85

R Aj CV
0.75 2.70

Cuadro de Anlisis de la Varianza (SC tipo III)


F.V.
SC
gl
CM
Modelo
1127.31
13
86.72
Bloque
214.59
3
71.53
Irrigacin
754.66
1
754.66
Variedad
129.92
3
43.31
Bloque*Irrigacin
18.09
3
6.03
Irrigacin*Variedad
10.03
3
3.34
Error
195.06
18
10.84
Total
1322.37
31
Test:Duncan Alfa:=0.05
Error: 10.8368 gl: 18
Bloque
Medias
n
II
124.80
8
I
122.55
8
IV
122.30
8
III
117.68
8

A
A
A

F
p-valor
8.00 <0.0001
6.60 0.0033
69.64 <0.0001
4.00 0.0241
0.56 0.6504
0.31 0.8188

Letras distintas indican diferencias significativas(p<= 0.05)

15

Test:Duncan Alfa:=0.05
Error: 10.8368 gl: 18
Irrigacin Medias
n
Alta
126.69
16
Moderada
116.98
16

A
B

Letras distintas indican diferencias significativas(p<= 0.05)

Test:Duncan Alfa:=0.05
Error: 10.8368 gl: 18
Variedad
Medias
n
2
124.88
8
4
122.43
8
3
120.08
8
1
119.95
8

A
A

B
B
B

Letras distintas indican diferencias significativas(p<= 0.05)

Test:Duncan Alfa:=0.05
Error: 10.8368 gl: 18
Bloque
Irrigacin
II
Alta
IV
Alta
I
Alta
III
Alta
II
Moderada
I
Moderada
IV
Moderada
III
Moderada

Medias
130.13
128.13
126.88
121.63
119.48
118.23
116.48
113.73

n
4
4
4
4
4
4
4
4

A
A
A

B
B
B
B

C
C
C

Letras distintas indican diferencias significativas(p<= 0.05)

Test:Duncan Alfa:=0.05
Error: 10.8368 gl: 18
Irrigacin Variedad
Alta
2
Alta
4
Alta
3
Alta
1
Moderada
2
Moderada
4
Moderada
1
Moderada
3

Medias
129.05
128.05
125.20
124.45
120.70
116.80
115.45
114.95

n
4
4
4
4
4
4
4
4

A
A
A
A

B
B
B

C
C

D
D
D

Letras distintas indican diferencias significativas(p<= 0.05)

En este ejemplo hubo diferencias significativas entre irrigaciones (<0.0001) y entre


variedades (0.024), y no hubo diferencias en las interacciones, debido a esto se analizan
por separado los componentes principales con una prueba de Duncan. El resultado que la
mejor variedad fue la nmero 2 y la mejor irrigacin fue la alta, considerando que el
rendimiento de las parcelas es independiente de las interacciones. Ntese que la prueba de
Duncan hizo grupos con las interacciones entre variedad e irrigacin, sin embargo si el
ANDEVA demostr que no existan diferencias al 5% (p=0.05), entonces la
categorizacin de la prueba es invlida.
6. Curvas de respuesta (regresin y correlacin)
Como se mencion anteriormente existen una serie de datos que no pueden ser analizados
mediante la comparacin de medias como por ejemplo niveles de fertilidad, dosis de

16

producto, niveles de inclusin de un producto alimenticio, niveles de urea en la


alimentacin del ganado, etc. Las curvas de respuestas o curvas de regresin son la
alternativa ms segura para analizar correctamente estos datos, las cuales nos reflejarn la
respuesta o comportamiento que tiene un factor de estudio con respecto a los diferentes
niveles de un tratamiento. Adems estas permiten representar matemticamente por medio
de una ecuacin la relacin entre las variables. Miremos algunas de las curvas de respuestas
ms usadas.
6.1 Regresin lineal
Podemos ver esto con un ejemplo prctico. Un tcnico forestal est interesado en
determinar el crecimiento en dimetro de los pinos a partir del volumen de su copa.
Mediante de un anlisis de regresin si existe una relacin significativa entre las dos
variables y expresar, por medio de una ecuacin, la relacin entre el crecimiento del rbol y
su volumen. Esta ecuacin permitir predecir cual sera el crecimiento del rbol para
determinado volumen de copa. A continuacin los datos con las mediciones.
Volumen
22
6
93
62
84
14
52
69
99
98
41
85
90

Crecimiento
0.36
0.09
0.67
0.44
0.72
0.24
0.33
0.61
0.64
0.65
0.47
0.6
0.51

Copiamos esta tabla y la pegamos incluyendo los nombres de las columnas en una tabla
nueva en INFOSTAT. Vamos a Anlisis y seleccionamos regresin lineal. Asignamos como
Variable dependiente a Crecimiento y Variable regresora o independiente a Volumen. La
salida en este anlisis genera tres ventanas: una sobre anlisis de varianza de la regresin, la
segunda un grafico representado la regresin en un plano x,y y la tercera es una ventana de
herramientas para mejorar la calidad del grfico al gusto del investigador. Las tres ventanas
se muestran en la siguiente imagen.

17

Observando la ventana de anlisis de varianza podemos afirmar que la ecuacin de


regresin lineal explica claramente la relacin entre el volumen y crecimiento. El
coeficiente de correlacin de Pearson (R) es igual a la raz cuadrada del coeficiente de
determinacin (R= R2). Por tanto el Coeficiente de correlacin de Pearson es R= 0.91, lo
que significa que el 91% de los cambios en el dimetro son explicados por un cambio en el
volumen.
Por otra parte podemos observar el modelo de regresin lineal es significativo para esta
relacin lineal con un nivel de confianza de 99%. La regresin lineal se define con la
ecuacin

y = a+bX.
y = Crecimiento
a = Intercepto
b = Coeficiente de regresin lineal del volumen
x = Volumen
Considerando el valor estimado de los parmetros y su significancia en el resultado de el
anlisis de varianza, el modelo de regresin lineal quedara expresado de la siguiente
manera:

Crecimiento = 0.16 + 0.01*Volumen

18

6.2 Regresin cuadrtica


No todas las relaciones entre las variables se pueden expresarse como relacin lineal, sino
que la relacin entre ellas puede ser explicada por otros tipos de ecuaciones. Como por
ejemplo los niveles crecientes de fertilizantes en los cultivos no siempre significan niveles
crecientes del rendimiento, por tanto su relacin no se puede definir como lineal; el
crecimiento natural de poblaciones de insectos no siempre presenta un comportamiento
lineal debido a que este proceso fisiolgico tiene sus limites.
Para explicar mejor el tipo de regresin cuadrtica resolvamos el siguiente ejemplo: Se
quiere determinar un modelo que represente la relacin entre el rendimiento del maz con
diferentes niveles de fertilizantes.
Dosis
0
100
200
300
400
500

Rendimiento
12.5
18.6
24.6
28.3
21.3
14.4

Este cuadro se debe copiar y se pega incluyendo los nombres de las columnas

El modelo cuadrtico a probar es el siguiente:

Y = a + b*x +c*x2
y=

Rendimiento
a = Intercepto (Const)
b = Coeficiente de regresin lineal
c = Coeficiente de regresin cuadrtica
x = Dosis de fertilizante
Rendimiento = a + b (Dosis de fertilizante) + c (Dosis de fertilizante)2
Una vez teniendo la tabla de datos seleccionamos la opcin de Anlisis de INFOSTAT y
hacemos click en Regresin no lineal, definimos a variable dependiente como
Rendimiento, y Dosis como la variable independiente. Se presenta una tabla donde se nos
pide la estructura de la regresin que queremos probar. Para este caso digitaremos la
siguiente estructura
a+b*Dosis+c*(Dosis*Dosis)

Posteriormente damos clic en Verificar la sintaxis del modelo, y Aceptar. La salida del
programa es la siguiente:

19

Se puede observar que el programa analiz los datos por medio de una regresin cuadrtica,
adems produce un grfico que representa la relacin entre las variables, con una curva
ajustada

El valor de p (pvalor)
demuestra que todos los parmetros son significativos por tanto el modelo cuadrtico que
representa esta regresin quedar de la siguiente forma:

20

Rendimiento = 11.46 + 0.11 * (Dosis) -0.00021 *(Dosis)2


Debe recordarse que el modelo se estructura con los valores estimados de los parmetros
(Est.)
7. Grficos en INFOSTAT
Una de las cosas importantes que se debe recordar es la frase trillada pero muy cierta es que
un un grfico dice ms que mil palabras. . Para el diseo de los grficos,
INFOSTAT posee herramientas suficientes y necesarias para generar grficos de excelente
calidad que pueden ayudar a mejorar la calidad de presentacin de los datos de sus
investigaciones.
A continuacin generaremos un grfico en base a datos facilitados por estudiantes. La
investigacin est basada en estudio del efecto de diferentes proporciones de Nitrgeno
Azufre, sobre la ganancia de peso de novillos en kg/animal. Podemos observar la tabla de
datos a continuacin:
Rep. Tratamiento 3D
1
Nit/Azu10:1
11
2
Nit/Azu10:1
10
3
Nit/Azu10:1
10.5
4
Nit/Azu10:1
11.2
1
Nit/Azu15:1
12.8
2
Nit/Azu15:1
13
3
Nit/Azu15:1
12.8
4
Nit/Azu15:1
12.7
1
Nit/Azu20:1
12
2
Nit/Azu20:1
12.6
3
Nit/Azu20:1
12.1
4
Nit/Azu20:1
12.3
1
Mel/urea
11
2
Mel/urea
11.5
3
Mel/urea
11.2
4
Mel/urea
11.1
1
Test/pasto
12
2
Test/pasto
11.1
3
Test/pasto
11.4
4
Test/pasto
11.7

6D
9D
12D
11.4
11
11.5
10.7 11.1
11.7
10.8 11
11.3
11.4 11.3
11.1
13 12.8
12.6
12.6 12.6
12.9
12.9 12.9
13.2
13.1 13
13.1
12.8 12.1
12.4
12.3 12.9
12.4
12.7 12.8
12
12.5 12.7
12.9
11.2 9.9
10.3
11.4 10.6
10.8
10.5 11.2
11.4
11 10.7
11
11.8 11.4
11.2
11 11.3
10.8
11.7 11.1
11
11.9 11.4
11.3

15D
11.1
10.9
11.1
11.5
12.8
13
13.1
12.9
12.3
12.1
12.5
12.4
10.3
11
11.1
10.9
11
10.9
10.7
11

18D
10.8
11.5
11.4
11.5
13.1
13.1
13.2
13
12.8
12.9
12.3
12
10.7
11.2
11
11.3
11.3
11.5
11.6
11

21D 24D
11.2 11.3
11.3 11.5
11.1 11.3
11.2 11.6
13
13.1
13.2
13
12.9
13
12.8 13.2
12.8 12.5
12.7 12.9
12.4 12.8
12.7 12.3
11.1 11.2
12.1 11.8
11.7 11.4
11.6 11.3
12
11.3
11.2 11.4
11
11.5
11.7 11.7

27D
11.1
11.4
11.6
11.3
13
12.8
12.7
12.9
12.4
11.9
12.3
12.1
11.3
11.4
11.7
11.4
11.1
11.2
11.3
11.9

30D
11.6
11.3
11.2
11.4
12.9
13.1
12.9
12.7
12.2
12.1
12.1
11.9
11.6
11
11.3
11.9
11.5
11.7
11.6
11.5

A continuacin seleccionamos la tabla generada en M.S. Excel y la pegamos incluyendo


nombre de las columnas en una tabla nueva en INFOSTAT. Posteriormente seleccionamos
de la barra de herramientas la opcin Grficos; y damos click en el tipo de grfico llamado
Diagrama de perfiles multivariados. Se desplegar una ventana donde nos pregunta el
tipo de variable a graficar y los perfiles u opciones de clasificacin de las variables a
graficar. Para este caso seleccionamos todas las columnas que representan los periodos que
21

se tomo los datos como Variables y seleccionamos a tratamiento como los Perfiles que
queremos clasificar los datos acomo se muestra en la siguiente figura.

Ttulo
13.11

Escala comn

12.47

11.83

11.19

10.55
C3

C6

C9

C12

C15

C18

C21

C24

C27

C30

Con estas indicaciones el grfico generado ser el siguiente:

Una vez obtenido el


darle mayor calidad a
con el uso de las
que ofrece el programa

grfico, es importante
estos y se puede hacer
Herramientas grficas
INFOSTAT.

22

23

Вам также может понравиться